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图 氛 基 传统 计算 机 科学 教材 的 枯燥 万 式 
图 将 抽象 理论 具体 化 、 复 杂 问 题 和 沿 早 化 
图 传授 实现 高 效 程序 设计 至 关 重 要 的 基础 知识 
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沃 德 斯 顿 。 费 雷 拉 “。 JERS 


(Wladston Ferreira Filho ) 
程序 员 ， 现 任职 于 Code Energy。 极 简 主 
义 者 。 热 衷 于 学 习 各 种 编程 语言 。 





出 身 电 子 与 计算 机 工程 专业 的 非 资深 产 
品 经 理 ， 多 年 来 致力 于 Web 开 发 与 软件 
架构 设计 ， 对 算法 和 数据 密集 型 应 用 兴 
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戏子 版 权 巨 明 


图 灵 社 区 的 电子 书 没 有 采用 专 有 客户 
mw, BAUERA HACH 
欢 的 浏览 器 和 PDF 阅读 器 进行 阅读 。 
但 您 购买 的 电子 书 仅 供 您 个 人 使 用 ， 
未 经 授权 ， 不 得 进行 传播 。 

我 们 愿意 相信 读者 具有 这 样 的 民 知 和 
帝 悟 ， 与 我 们 共同 保护 知识 产权 。 
如 果 购 买 者 有 侵权 行为 ， 我 们 可 能 对 
该 用 户 买 施 包括 但 不 限于 关闭 该 帐号 
等 维权 措施 ， 并 可 能 奶 究 法 律 责任 。 
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内 容 提 要 
本 书 以 浅显 易 异 的 语言 、 人 简明 扼要 的 形式 介绍 计算 机 科学 领域 的 重要 知识 
点 ， 较 少 涉及 学 术 概 念 ， 着 力 将 抽象 理论 具体 化 、 复 杂 问 题 简 单 化 。 主 要 内 容 
包括 逻辑 、 计 数 等 基本 概念 ， 数 据 类 型 ， 算 法 ， 计 算 机 体系 结构 ， 程 序 设 计 ， 
等 等 。 
本 书 既 适合 计算 机 专业 技术 人 员 ， 也 适合 对 计算 机 科学 感 兴趣 的 普通 读者 。 
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碳 文 原版 由 Code Energy LLC Khk, 2017. 


向 体 中 文 版 由 人 民 邮 电 出 版 社 出 版 ，2019。 英 文 原版 的 翻译 得 到 Code 
Energy LLC 的 授权 。 此 简体 中 文 版 的 出 版 和 销售 得 到 出 版 权 和 销售 权 
的 所 有 者 Code Energy LLC 的 许可 。 


版 权 所 有 ， 未 得 书面 许可 ， 本 书 的 任何 部 分 和 全 部 不 得 以 任何 形式 重 制 。 








我 知道 2 加 2 等 于 4， 如 果 能 证 明 这 一 点 我 会 很 高 兴 ， 但 必须 承 
认 ， 如 果 能 让 2 加 2 等 于 5， 那么 我 会 更 高 兴 。 
— He i ý 
取 自 1813 Fa KÉZ N ANE h, 
他 们 的 女儿 埃 达 . 洛 夫 莱 斯 是 第 一 位 程序 员 。 


译 者 P 


本 书 炎 文 版 封面 图 片 根据 1845 年 的 一 份 分 析 机 原理 图 绘制 。 分 析 机 起 
历史 上 第 一 种 可 编程 计算 机 ， 也 是 其 发 明 者 查尔斯 ' 巴 贝 奇 得 以 在 计算 
机 史上 留 名 的 主要 作品 。 


巴 贝 奇 堪 称 “ 跨 界 ”高 手 。 他 颇具 数学 天 分 ， 曾 受聘 担任 剑桥 大 学 卢 卡 
斯 教授 ， 他 被 誉 为 计算 机 先驱 ， 为 差分 机 与 分 析 机 的 发 明 耗 尽 一 生 心 
血 ， 他 还 是 当时 知名 的 经 济 学 家 ， 曾 撰写 19 世纪 30 年 代 最 有 影响 力 的 
经 济 学 著作 《 论 机 械 和 制造 业 的 经 济 》。 


巴 贝 奇 同样 症 一 位 理想 主义 者 。 在 类 国政 府 停 止 对 差分 机 项 目的 资助 
后 ， 巴 贝 奇 依然 钢 而 不 舍 ， 开 始 设计 功能 更 为 强大 的 分 析 机 。 它 分 为 运 
算 单 元 与 存储 单元 ， 通 过 打 了 筷 卡 进行 输入 ， 并 使 用 与 汇编 语言 类 似 的 编 
程 语言 。 分 析 机 将 运算 、 存 储 、1O 功能 相互 分 离 ， 与 如 今 的 计算 机 有 
异曲同工 之 妙 。 


然而 ， 在 缺乏 政府 资助 的 情况 下 制造 分 析 机 ， 无 异 于 纸上谈兵 ， 最 终 留 
下 的 只 有 数 和 干 页 设计 手稿 。 郁 郁 不 得 志 的 巴 贝 奇 于 1871 年 去 世 ， 报 纸 
其 至 还 在 让 告 中 嘲笑 了 他 的 失败 。 


但 巴 贝 奇 并 非 没有 知音 。 在 都 灵 访 问 期 间 ， 他 或 励 后 来 担任 意大利 首相 
的 路 易 吉 * 梅 纳 布 雷 亚 撰写 一 篇 有 关 分 析 机 的 论文 。 这 份 以 法 语 写 就 的 
论文 于 1842 年 出 版 ， 后 来 被 车 名 诗人 拜 伦 的 女儿 埃 达 ' 拜 伦 译 为 英文 。 
RERI E NATERA AATF 1833 年 相识 后 一 直 保 持 联 系 。 
埃 达 继承 了 母 茶 的 数学 天 分 ， 丰 为数 不 多 能 次 刻 理 解 巴 贝 琳 思想 的 人 ， 
她 其 至 变卖 目 己 的 珠 至 以 文 持 分 析 机 的 制造 。 

埃 达 并 非 向 单 地 翻译 梅 纳 布雷 亚 的 论文 ， 她 还 添加 了 几乎 达到 原文 长 度 
四 倍 的 注 记 ， 详 细 摘 述 了 使 用 分 析 机 计算 伯 努 利 数 的 方法 ， 并 设计 了 世 
界 上 第 一 个 计算 机 程序 。 埃 达 由 此 被 视 为 历史 上 第 一 位 程序 员 。 为 纪念 
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她 的 页 献 ， 美 国 国 防 部 将 1980 年 发 布 的 一 门 编程 语言 命名 为 Ada, 


《计算 机 科学 精粹 》 雯 称 一 本 “网 红 ” 书 ， 出 版 之 后 好 评 如 寡 ， 许 多 亚 
马 进 用 户 之 不 音 瘟 地 打出 五 星 高 分 。 本 书 适 合 各 个 层次 、 各 种 背景 的 读 
者 阅读， 无 论 息 经验 不 足 的 新 人 ， 还 是 科班 出 里 的 老手 ， 想 必 都 能 从 中 
找到 适合 目 己 的 内 容 。 学 习 本 非 枯燥 之 事 ， 但 一 本 浅显 多 懂 的 入 门 图 书 
的 确 有 事半功倍 之 效 。 


在 北美 的 院 校 中 ， 某 些 考试 允许 携带 cheat sheet (中 文 可 称 为 “ 备 扎 单 ” 
或 “ 速 查 表 ”)， 学 生 可 以 将 自己 认为 重要 的 公式 或 知识 点 写 在 上 面 。 从 
某 种 意义 上 说 ,《 计 算 机 科学 精粹 》 就 是 这 样 一 本 具有 cheat sheet 性 质 
的 书 。 与 图 灵 推 出 的 《算法 图 解 》 类 似 ， 本 书 以 浅显 易 民 的 语言 梳理 了 
计算 机 科学 领域 的 重要 知识 点 ， 着 力 将 抽象 的 理论 具体 化 、 复 杂 的 问题 
向 单 人 化。 当然， 亦 想 抛砖引玉 ， 和 希 户 在 唤起 读者 对 计算 机 科学 的 兴 
ja, RERA WREE 


非常 感谢 北京 图 灵 文 化 发 展 有 限 公 司 的 朱 钢 老师 给 予 译 者 的 信任 ， 以 及 
李冰 编辑 为 本 书 付 梓 所 做 的 侠 惑 努力 。 虽 然 译 者 尽力 而 为 ， 但 水 平 有 
限 ， 足 漏 之 处 在 所 难免 。 居 请 读者 不 癌 赐教 ， 提 出 宝 吐 的 意见 和 建议 。 
译 者 的 联系 方式 : milesjiang314@gmail.com。 
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朋友 是 我 们 为 自己 选择 的 亲人 。 本 书 献 给 Re Léo. Moto 
与 Chris， 他 们 不断 敦促 我 “完成 这 部 该 死 的 作品 


Dii 


BJ 


每 个 人 都 应 该 学 习 计 算 机 编程 ， 因 为 它 教 会 你 如 何 思考 。 
一 一 史 带 夫 ' 乔 布 斯 


计算 机 以 前 所 未 有 的 力量 改变 了 世界 ， 一 门 新 学 科 随 之 兴起 ， 这 融 是 计 
算 机 科学 。 它 揭示 了 如 何 利 用 计算 机 解决 问题 ， 帮 助 我 们 充分 发 挥 计 算 
机 的 洋 能 。 在 这 门 学 科 的 指引 下 ， 我 们 取得 了 难以 置信 的 成 就 。 


计算 机 科学 无 处 不 在 ， 但 学 校 传授 的 仍然 是 枯燥 的 理论 ， 不 少 程序 员 其 
至 从 未 研究 过 它 。 然 而 ， 计 算 机 科学 对 于 实现 高 效 的 程序 设计 至 关 重 
要 。 我 的 一 些 朋 友 很 难 聘用 到 优秀 的 程序 员 一 一 计算 机 虽然 功能 强大 ， 
可 以 获 驭 它 的 人 却 不 多 。 

我 希望 通过 这 本 书 推动 读者 高 效 地 使 用 计算 机 。 本 书 将 以 简明 扼要 的 形 


式 介 绍 计算 机 科学 的 知识 ， 尽 量 少 涉及 学 术 概 念 。 但 愿 计算 机 科学 能 在 
读者 心中 扎根 ， 并 提高 读者 编写 代码 的 水 平 。 
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1 “计算 机 问题 ”( 取 自 https://xkcd.com/) 
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目标 读者 


对 于 希望 采用 高 效 方法 解决 问题 的 读者 ， 本 书 将 是 不 二 之 选 。 编 程 经验 
并 非 必 需 ， 如 有 果 读 者 曾经 写 过 代码 ， 也 了 解 for 与 while 这 样 的 基本 
编程 语句 ， 阅 读本 书 将 不 会 过 到 任何 障碍 。 不 熟悉 计算 机 科学 的 读者 可 
以 通过 Codecademy” 进行 学 习 ， 其 在 线 课程 提供 一 周 的 免费 试听 服务 。 
而 对 具备 计算 机 科学 经 验 的 读者 来 说 ， 本 书 能 有 效 地 巩固 所 学 知识 。 





计算 机 科学 并 非 只 和 学 者 有 关 


这 是 一 部 关于 计算 思维 的 作品 ， 适 合 所 有 人 阅读 。 读 者 将 学 习 如 何 把 问 
题 转换 为 可 计算 的 系统 ， 并 在 日 第 生活 中 应 用 计算 思维 : 预 取 和 绥 存 能 
简化 打包 过 程 ， 而 并 行 有 助 于 提高 就 饪 速度 。 男 外 ， 读 者 的 代码 会 变 得 
很 棒 ! 


愿 原 力 与 你 同 在 。2 轿 








O 许多 平台 都 提供 不 错 的 在 线 课程 ， 涵 盖 Web 开发 、 数 据 处 理 、 人 工 智 能 、 深 度 学 习 
等 多 个 领域 。lynda.com、Udacity 都 是 北美 较为 知名 的 在 线 教育 平台 。 译 者 注 
(2 《星球 大 战 》 中 绝地 武士 在 分 别 时 表示 “再 见 ” 的 视 福 语 ， 后 引申 为 现实 世界 中 粉 

缘 之 间 的 祝福 语 。 一 一 译 者 注 
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碍 尔 斯" 巴 贝 奇 的 分 析 机 原理 图 


计算 机 科学 并 非 一 门 研究 机 器 的 学 科 ， 如 同 天 文学 并 非 研究 户 
远 镜 一 样 。 从 本 质 上 讲 ， 数 学 与 计算 机 科学 具有 统一 性 。 
一 一 艾 诊 赫 尔 . 戴 克 斯 特 拉 ” 


计算 机 只 能 处 理 分 解 成 块 的 问题 ， 因 此 我 们 需要 具备 一 定 的 数学 知识 。 
不 过 无 须 芭 张 ， 数 学 并 非 高 次 莫 测 ， 编 写 优 秀 的 代码 也 很 少 要 用 到 复杂 
的 方程 。 这 一 草 将 介绍 求解 问题 所 需 的 基本 知识 ， 包 括 : 


t 采用 流程 图 与 伪 代 码 对 想法 进行 建 模 
V 根据 逻辑 判断 对 鱼 

02 对 事物 进行 计数 

e 安全 地 计算 概率 


笃 担 这 些 知识 后 ， 我 们 就 能 将 自己 的 想法 转换 为 可 供 计 算 机 执行 的 解决 
方案 。 





1.1 想法 


面 对 复 杂 的 问题 时 ， 请 让 大 脑 保持 节 佳 状态 ， 将 所 有 重要 内 容 写 下 来 。 
我 们 的 大 脑 很 容易 被 各 种 事实 和 想法 所 淹没 ,好 记性 不 如 烂 笔 涉 ” 在 
众多 组 织 方法 中 占有 重要 地 位 。 为 此 ， 这 一 万 将 讨论 几 种 实现 方法 。 首 
先 介绍 用 于 表示 进程 的 流程 图 ， 然 后 利用 伪 代 码 编写 可 供 实 际 编 程 使 用 
的 进程 ， 并 尝试 通过 数学 工具 对 一 个 简单 的 问题 进行 建 模 。 





O KRR e aarp (Edsger Dijkstra，1930 一 2002)， 和 荷兰 计算 机 科学 家 ， 其 页 
献 涵 瘟 编译 器、 操作 系统 、 分 布 式 系统 、 软 件 工程 、 编 程 语言 、 图 论 等 多 个 领域 ， 
数据 结构 中 的 最 短路 径 算 法 一 一 戴 克 斯 特 拉 算 法 就 是 以 他 的 名 字 命名 的 。1972 年 ， 
戴 克 斯 特 拉 因 在 编程 语言 方面 的 贡献 而 获得 图 灵 奖 。 一 一 译 者 注 
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1.1.1 流程 图 


在 讨论 相互 之 间 的 协作 过 程 时 ， 维 基 人 ”创建 了 一 种 随 着 讨论 的 进行 而 
更 新 的 流程 图 。 对 所 提出 的 内 容 了 然 于 心 有 助 于 讨论 。 





与 其 他 人 讨论 


这 个 问题 









你 的 版 本 是 否 被 
其 他 人 修改 过 ? 


图 1-1 维基 百科 编辑 流程 


与 上 面 的 编辑 流程 类 似 ， 计 算 机 代码 本 质 上 是 一 种 进程 。 程 序 员 通常 使 
用 流程 图 来 编写 计算 进程 。 为 便于 他 人 人 理解， 绘制 流 程 图 时 应 遵循 以 下 
原则 >， 


D 将 状态 步 又 和 指令 步骤 置 于 矩形 框 内 ， 
DO 将 决策 步骤 (对 给 定 的 条 件 进行 判断 ) TS Een, 
口 不 要 将 指令 步 又 与 决策 步 又 放 在 一 起 ， 
O 使 用 鼻头 连接 各 个 顺序 步 桑 ， 
O 标明 进程 的 开始 和 结束 。 
OD 维基 人 指 在 维基 百科 上 编写 条 目的 贡献 者 ， 女 性 维基 人 有 时 候 也 被 称 为 “ 竹 姬 
人 ”。 一 一 译 者 注 
D 国际 标准 化 组 织 甚至 专门 制定 了 一 项 称 为 UML (统一 建 模 语 言 ) 的 标准 来 定义 软 
件 系 统 图 的 绘制 。 








我 们 以 查找 3 个 数 中 的 最 大 值 为 例 ， 来 看 看 如 何 绘制 流程 图 。 


读 取 数字 A、B、C 





图 1-2 查找 3 个 变量 中 的 最 大 值 


1.1.2 HRIB 


与 流程 图 类 似 ， 伪 代码 也 可 以 用 来 表示 计算 进程 。 它 十 一 种 符合 人 类 
阅读 习惯 的 代码 ， 但 无 法 被 机 带 理 解 。 下 面 这 个 示例 与 图 1-2 的 含义 相 
同 ， 读 者 不 妨 花 些 时 间 ， 选 取 若 干 样本 值 作为 A、B、C 尝试 一 下 。™ 


function maximum(A, B, C) 
if A> B 
if A> C 
max < A 
else 
max é C 





else 
if Bo C 
max ée B 
else 
max é C 
print max 


Iert al, PRADERA ENEE LU SENAN REE 





O 在 本 例 中 ， 一 表示 赋值 运算 符 。 因 此 , xv, 1 的 含义 是 “将 x 设置 为 1”。 
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可 以 在 伪 代 码 中 使 用 茶 些 口语 ! 如 同 利用 流程 图 绘制 一 般 性 思维 导 图 那样 ， 
就 让 我 们 的 创造 力 在 编写 伪 代 码 时 得 到 充分 释放 吧 (如 图 1-3 所 示 ) | 


伪 代 , 码 在 现实 生 污 中 的 应 用 6) Eto 
a 描述 算法 | 


Lk 
H | 。 
DELS EEN ER 
REES dance +t 


这 他 们 SS iz 的 工具 ) # mylife ge partyharð 
boss 0 ARE 
1-3 “现实 生活 中 的 伪 代 码 ”( 取 自 http:/ctp200.com) 





1.1.3 ”数学 模型 


模型 是 一 组 表示 问题 及 其 特征 的 概念 ， 有 助 于 更 好 地 推断 与 处 理 问 题 。 
创建 模型 的 重要 性 毋 良 置疑， 我 们 从 小 就 受过 这 方面 的 训练 。 中 学 数学 
的 思路 是 (或 应 该 是 ) 将 问题 建 模 为 若干 数字 和 方程 ， 然 后 应 用 各 种 工 
有 具 进行 求解 。 

采用 数学 语言 描述 的 模型 具有 一 个 无 可 比拟 的 优势 : 它们 能 在 使 用 完备 
数学 工具 的 计算 机 上 运行 。 如 果 模 型 中 包含 图 ， 可 以 使 用 图 论 ， 如 果 包 
含 方程 ， 代 数 将 派 上 用 场 。 利 用 前 人 创造 的 这 些 工具 ， 问 题 就 能 迎 刃 而 
解 。 接 下 来 ， 我 们 讨论 一 个 经 常 在 中 学 数学 中 出 现 的 问题 。 

Kamie ”农场 里 饲养 了 两 种 家 畜 。 我 们 利用 100 个 单位 长 


度 的 铁丝 网 制作 一 个 矩形 围栏 ， 中 间 用 直线 将 两 种 动物 隔 开 。 
那么 应 该 如 何 设 计 围 栏 ， 才 能 让 牧场 的 面积 最 大 化 ? 
我 们 从 需要 求解 的 值 入 手 分 析 。 如 果 w 和 1 为 牧场 的 边 长 ， 那 么 二 者 的 
乘积 就 是 牧场 的 面积 。 面 积 最 大 化 意味 着 使 用 所 有 铁丝 网 ， 因 此 ww 和: 
与 100 之 则 具有 以 下 关系 。 
A=wxl 
100 = Zut Af 
现在 ， 问 题 变 成 了 ww 和 1 取 何 值 ， 才 能 
使 面积 4 最 大 。 
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根据 第 二 个 方程 求 出 1 (1=10 2 )， 然 后 代入 第 一 个 方程 ; 
Ja N Zu 
3 3 


由 此 得 到 一 个 二 次 方程 ， 利 用 中 学 时 学 过 的 二 次 公 坏 很 容易 就 能 求 出 它 
的 最 大 值 。 设 4 = 0 并 求解 方程 ， 最 大 值 为 两 个 根 之 间 的 中 把。 二 次 方 
程 之 于 我 们 ， 如 同 高 压 锅 之 于 厨师 ， 两 种 工具 的 共同 上 后 古 可 以 万 省 时 
间 。 二 次 方程 能 加 快 许多 问题 的 求解 速度 ， 而 我 们 的 任务 就 征 解决 问 
题 ， 这 一 点 请 唐 记 在 心 。 厨 师 需 要 了 解 他 的 工具 ， 我 们 同样 需要 笃 担 目 
己 的 工具 ， 数 学 模型 就 是 我 们 手中 的 有 力 工 具 。 除 此 之 外 ， 次 辑 也 是 解 
决 问 题 的 法 至 。 


1.2 ”逻辑 


程序 员 与 逻辑 打交道 太 频 繁 ， 思 维 都 伞 隐 辑 搞 得 一 团 精 。 尽 管 如 此 ， 不 少 
程序 员 其 实 并 未 真正 笃 担 逻辑 的 知识 ， 只 是 凭借 “本 能 ”在 使 用 它 。 理 
解 形式 逻辑 的 概念 之 后 ， 我 们 就 可 以 用 它 来 审慎 地 解决 问题 。 








员 et 没 人 人 能 理 解 


可 你 为 什么 这 样 


程序 


string sender; 
sender = "Joseph F"; 


我 大 大 让 我 去 趟 超市 ， 她 超市 确实 有 土豆 。 不 过 
说 ; “有 买 6 个 鸡蛋 回来 。 如 当 我 只 带 兰 9 个 炮 蛋 回来 
果 有 土豆 ， 就 买 9 个 。“ 约 时 候 ， 她 就 发 般 了 。 





CC Í u 
1-4 “程序 员 的 逻辑 ”( 取 自 http://programmers.life) 
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在 这 一 节 ， 我 们 首先 采用 特殊 的 运算 符 和 代数 来 处 理 逻 辑 陈述 ， 然 后 学 
习 利用 真 值 表 解决 问题 ， 并 探讨 计算 机 是 如 何 依靠 逻辑 来 工作 的 。 


\ 一 Ai Ar 


1.2.1 ZATI 


普通 数学 使 用 变量 与 运算 符 (二 、 一 、X 等 ) 对 数值 问题 进行 建 模 。 
在 数理 逻辑 中 ， 变 量 与 运算 符 表示 事物 的 有 效 性 ， 它 们 代表 的 是 真 
(True) 或 假 (False) 而 非 数字 。 例 如 ， 表 达 式 “如 东 痰 池 很 暖和 ， 
我 就 去 洲 访 ”的 有 效 性 基于 两 件 事 的 有 效 性 ， 二 者 可 以 被 映射 到 逻辑 变 
量 A 和 B。 





A: 冰 闻 很 瞬 和 。 

B: RAWU. 
A 和 B 要么 为 True， 要么 为 FaLse。'94 = True 表示 “泳池 很 暖和 ”，B = 
False 表示 “我 不 去 游 文 ”"。B 不 可 能 为 半 真 ， 因 为 “我 ”不 可 能 一 半 
去 游泳 ， 一 半 不 去 游 广 。 变 量 之 间 的 依赖 关系 通过 条 件 运算 符 一 表示 ， 
A 一 B 意味 着 “ 当 A=True 轩 , B=True”, 

A 一 B: 如 果 冰 池 很 能 和 ， 我 束 去 洲 六 。 

借 由 其 他 运算 符 ， 我 们 能 表示 更 多 的 含义 。 例 如 ， 取 反 运 算 符 ! RRE 
E, A 的 含义 是 对 4 取 反 。 

LA, 冰 池 很 深 。 

1B. RAEI. 
换 质 位 法 ” 当 给 定 “A 一 B 5 RARI” IW. peT HEN HE Hib 
的 情况 呢 ?” 由 于 “六 池 很 暖和 ”会 强制 “我 去 游 访 ”， 如 果 “ 我 不 去 洲 
六 ， 就 说 明 “ 六 池 不 暧 和 ”。 每 个 条 件 表 达 式 部 有 相应 的 换 质 位 形式 .。 

对 于 任意 两 个 变量 A 和 B,， A 一 B 与 18B 一 !h 的 含义 相同 。 

我 们 再 来 看 一 个 例子 。“ 如 果 你 写 不 出 好 代码 ， 那 么 还 没有 读 过 本 书 ” 
的 换 质 位 形式 为 “如 果 你 读 过 本 书 ， 束 能 写 出 好 代码 ”。 换 言 之 ， 两 句 


O 在 模糊 逻辑 中 ， 值 也 可 以 介 于 两 者 之 间 ， 但 本 书 不 会 涉及 这 方面 的 内 容 。 
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话 采 用 不 同 的 方式 表达 了 相同 的 意思 。” 


双 条 件 WES, 如 采访 凶 很 暖和 ， 我 束 去 洲 冰 ”不 代表 “我 只 在 温 
水 中 游泳 *"， 这 一 陈述 并 未 对 六 池 冷 瞬 做 出 承诺。 也 就 是 说 ， A BA 
意味 着 B 一 A。 如 琳 希 望 两 个 条 件 邦 成 立 ， 需 要 使 用 双 条 件 。 


Auch, 当 且 仅 当 访 凶 很 暖和 ， 我 才 去 游 六 。 


HN. “KIBIR” P RTA EEA: 只 要 了 解 六 池 的 冷 
暧 ， 就 能 了 解 是 人 否 去 游泳， 反之 亦 然 。 需 要 再 次 强调 的 是 ， 应 谨防 反 向 
ER, PRUIM A > B 可 以 推断 出 B 一 A。 

逻辑 与 、 逻 辑 或 、 逻 辑 异 或 ”三 者 通 弟 是 显 式 编码 有 的， 它们 是 最 知名 的 
逻辑 运算 符 。 逻 辑 与 (AND) 表示 全 部 条 件 为 真 时 结 末 为 真 ， 逻 辑 或 
(OR) 表示 任意 条 件 为 真 时 结果 为 真 ， 逻 辑 异 或 (XOR) 表示 条 件 相反 
时 结 末 为 芙 。 芳 虑 一 个 提供 伏特 加 与 光 先河 的 聚会 。 


A: PRS TRA T 
B: 你 哆 了 伏特 加 。 子 
A OR PB. PRS TH. #: 
A AND B: DIS EAA. op 
A XORB: Mia ZAHER. B 


读者 应 掌握 目前 介绍 的 各 种 运算 符 的 工作 原理 。 表 1-1 列 出 了 两 个 变量 
所 有 可 能 的 组 合 。 请 注意 ，A 一 B 等 价 于 1!4 ORB, mA XOR B 等 价 
F (A-B). 


R 1-1 逻辑 运算 : 4 与 8 的 4 种 可 能 情况 











A B| 4 /3B Aë AANDB AORB AXORB 
X 


O 其实， 这 两 句 话说 得 一 点 也 没 错 。 荆 
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1.2.2 布尔 代数 

与 初等 代数 可 以 化 简 数值 表达 式 类 似 , 布尔 代数 2 可 以 化 简 逻 辑 表达 式 。 
结合 律 ” 插 号 不 影 啊 AND 或 OR 运算 的 顺序 。 与 初等 代数 中 的 求 和 与 
乘法 运算 类 似 ， 可 以 采用 任意 顺序 进行 计算 


A AND (B AND C) = (A AND B) AND C 
A OR (B OR C) = (A OR B) OR C 


分 配 律 ”在 初等 代数 中 ， 我 们 可 以 将 乘法 项 从 和 中 提取 出 来 : ax (ich 
(ax b)+ (axc)。 逻 辑 运 算 与 之 类 似 ， 两 个 变量 进行 OR 运算 后 再 与 第 

三 个 变量 进行 AND 运算 ， 相 当 于 两 个 变量 分 别 与 第 三 个 变量 进行 AND 
运算 后 再 进行 OR 运算 ， 反 之 亦 然 。 








A AND (B OR C) = (A AND B) OR (A AND C) 
A OR (B AND C) = (A OR B) AND (A OR ©) 


德 摩根 定律 ” 夏天 和 冬天 不 可 能 同时 出 现 ， 因 此 要 么 不 是 夏天 ， 要 么 
不 是 冬天 。 当 且 仅 当 不 满足 要 么 是 夏天 要 么 是 冬天 的 条 件 时 ， 说 明 既 不 
是 夏天 ， 也 不 是 冬天 。 根 据 上 述 推 理 ， 可 以 将 AND 运算 转换 为 OR 运 
算 ， 反 之 亦 然 。 


A AND 了 =!AORIB 
IA AND !B = !(A OR B) 


AA ERHAN A LIHAA AA, 28 d TE, R 
们 考虑 如 何 解决 以 下 问题 。 


D, 如果 服务 器 besse RAR, 同样 会 导致 服务 器 
vg. Ans a 


O 得 名 于 英国 数学 家 乔治 .布尔 〈1815 一 1864)。 他 在 1854 年 出 版 的 著作 中 引入 了 逻 
辑 学 与 数学 ， 布 尔 代数 由 此 诞生 。 

© 德 摩根 (1806 一 1871) 是 布尔 的 好 友 。 他 曾 辅导 过 年 轻 的 埃 达 ， 洛 夫 莱 斯 历 
史上 首位 程序 员 ， 比 第 一 台 计 算 机 问世 还 早 一 个 世纪 ，。 
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UD) d Se Alger, DESS portant ol CL ur E rs, 
A: HRS wE, 

B: 空调 关闭 。 (A AND B) OR (A AND ©) > D 

C: 机 箱 冷 却 絮 失效 。 

D 


: IKI aF na. 
采用 分 配 律 对 上 式 进行 因 式 分 解 : 
A AND (B OR C) > 
HWER !D 时 ， 服 务 器 可 以 正常 工作 。 相 应 的 换 质 位 形式 为 : 
ID > !(A AND (B OR CH 
用 德 摩根 定律 去 除 括号 : 
ID — !IA OR !(B OR C) 
然后 再 次 应 用 德 摩根 定律 : 
ID > !A OR (!B AND !C) 


从 上 式 可 知 ， 只 要 满足 条 件 UREA) 或 18B AND !C (空调 
和 机 箱 冷 却 如 均 正常 工作 ) ， 服 务 如 就 能 正常 工作 。 


1.2.3” 真 值 表 


分 析 迎 辑 模 型 的 另 一 种 方法 是 检查 所 有 可 能 的 变量 组 合 。 真 值 表 采用 列 
表示 变量 ， 行 表示 变量 状态 的 可 能 组 合 

每 个 变量 需要 两 行 ， 变 量 在 一 行 中 设置 为 True， 在 另 一 行 中 设置 为 
False。 如 采 需 要 增加 变量 ， 则 对 行进 行 复制 ， 并 在 原来 的 行 中 将 新 变 
量 设置 为 True， 在 复制 的 行 中 将 新 变量 设置 为 False (如 图 1-5 所 示 )。 








每 增加 一 个 变量 ， 真 值 表 的 大 小 将 增加 一 倍 ， 因 此 只 能 为 少量 变量 构建 
HER. 


O 一 张 由 30 个 变量 构成 的 真 值 表 ， 所 包含 的 行 数 将 超过 10 亿 。 偏 〈 即 对 于 nn 个 变 
量 (n 之 1)， 真 值 表 包 含 2 行 。 一 一 译 者 注 ) 
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回回 回回 回 


ATA ts bs CA 

Vo V V 加 加 四 加 

V V 

- 回 四 四 回 
> 
i e 
因 因 

GER 

KAKAGAKA A kas US CA 

园区 回回 回 

DEE 因 因 回回 因 


因 因 因 因 因 

1-5 由 1 到 5 个 逻辑 变量 构成 的 真 值 表 ， 包 括 所 有 可 能 的 变量 组 合 
接 下 来 讨论 如 何 利 用 真 值 表 分 析 问 题 。 

脆弱 的 系统 侣 ”我 们 需要 创建 一 个 满足 以 下 要 求 的 数据 库 系 统 。 

I: 如 果 数 据 库 锁定 ， 则 可 以 保存 数据 。 

II， 不 会 出 现 写 队列 已 满 且 数据 库 锁 定 的 情况 。 

M: 要 么 写 队 列 已 满 ， 要 么 缓存 已 加 载 。 

IV: 如 果 缓 存 已 加 载 ， 则 无 法 锁定 数据 库 。 





是 否 可 以 创建 满足 上 述 要 求 的 数据 库 系 统 ? 它 需要 满足 哪些 条 

件 才能 工作 ? 
首先 ， 我 们 将 每 项 要 求 转 换 为 一 个 逻辑 表达 式 。 可 以 使 用 4 个 变量 对 数 
据 库 系统 建 模 。 


4: 数据 库 锁 定 I: A—B 
B: 可 以 保存 数据 II: !(A AND C) 
C 写 队 列 已 满 HI: CORD 
D: 绥 存 已 加 载 IV: D>!A 


接 下 来 ， 我 们 根据 所 有 可 能 的 组 合 创建 真 值 表 。 为 检查 是 否 满 足 上 述 要 
求 ， 真 值 表 添 加 了 额外 的 列 。 
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表 1-2 真 值 表 : 探索 4 个 表达 式 的 有 效 性 
状态 编号 


1 


全 部 4 个 


2 


3 


SESEK E E E E E E3 > 
GRELL 
DG 
DG 
HHHHEEEERRHHHHHHI- 
HHH HHRHERRHEHHH EI: 
REH HERHHHHRHHHHI: 


HRH HHHHHHRHRH- 
DH 


可 以 看 到 ， 在 状态 2 到 4 以 及 状态 6 到 8 中， 所 有 要 求 均 得 到 满足 。 在 
这 些 状态 中 ，A = False， 表 示 数 据 库 永 远 不 会 锁定 。 只 有 在 状态 3 和 
状态 7 中 ,缓存 不 会 加 载 。 


为 检验 所 学 的 知识 ,请 读者 尝试 解答 斑马 难题 "。 这 是 一 个 著名 的 逻辑 问 
巅 ， 但 并 非 由 爱 因 斯 坦 提 出 。 据 说 只 有 2% 的 人 能 解决 这 个 问题 ,不 过 
我 对 此 表示 怀疑 。 使 用 一 张 较 大 的 真 值 表 ， 并 采用 正确 的 方式 化 简 与 合 
FERR, ARREARS RIER. 


BESACE gh bn nl pete Z — Ah, ARAE e AIR Err 
建 模 ， 借 此 不 难 推导 出 表达 式 并 进行 化 和 油 ， 进 而 得 出 结论 。 接 下 来 ， 开 
全 讨论 最 令 人 印象 深刻 的 逻辑 应 用 一 一 电子 计算 机 设计 。 


O 参见 https://code.energy/solving-zebra-puzzle/。 
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1.2.4 远 辑 在 计算 中 的 应 用 


一 组 逻辑 变量 可 以 表示 二 进 制 形式 的 数字 ， 针 对 二 进 制 数 字 的 逻辑 运算 
也 可 以 合并 以 执行 一 般 性 计算 。 逻 辑 门 对 电流 执行 逻辑 运算 ， 电 路 中 使 
用 的 逻辑 门 能 以 极 高 的 速度 进行 计算 。 

逻辑 门 从 输入 线 接收 值 并 进行 运算 ， 然 后 将 结果 置 于 输出 线 。 逻 辑 门 包 
括 与 门 (AND)、 或 门 (OR), $I] (XOR) 等 多 个 种 类 ， 高 低 电 平 
分 别 代 表 True 和 FaLse。 借 由 逻辑 门 ， 复 杂 罗 辑 表达 式 的 计算 几乎 可 
以 在 瞬时 完成 。 例 如 ， 图 1-6 所 示 的 电路 用 于 对 两 数 求 和 。 





Ao 


So 
e Ge 
xo — s, 
A 
AND 2 
T E> 


B, 

图 1-6 ”对 两 个 逻辑 变量 (4h, 5 BB) 给 出 的 2 位 数字 求 和 ， 结 果 是 一 个 3 
位 数字 (SS, 

请 读者 思考 上 述 电路 的 工作 原理 ， 并 花 些 时 间 观 察 电路 的 计算 过 程 

(图 1-7). 


Ee 
> 
2 
S 





图 1-7 计算 2+3=5 (二 进 制 为 10+11= 101) 








(D True = 1，False = 0。 如 果 读 者 不 清楚 为 何 二 进 制 数 101 表示 十 进 制 数 5， 请 参考 
附录 中 有 关 数 制 的 解释 。 
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为 利用 这 种 快速 的 计算 形式 ， 我 们 将 数值 问题 转换 为 相应 的 二 进 制 或 多 
辑 形式 。 真 值 表 有 助 于 电路 的 建 模 与 测试 。 布 尔 代 数 可 以 化 向 表达 式 ， 
电路 也 因此 得 以 向 化 。 


隐 辑 门 最 初 采用 举重 、 低 效 且 昂 贯 的 电动 阀 制造 。 在 唱 体 管 取代 电动 疾 
之 后 ， 逻 辑 门 实现 了 批量 生产 ， 人 们 也 一 直 在 探索 缩小 晶体 管 尺寸 的 途 
Z. O AÈ CPU 的 工作 原理 仍然 以 布尔 代数 为 基础 。 从 本 质 上 说 , 现代 
CPU 只 是 一 种 由 数 以 百 万 计 的 微观 导线 与 逻辑 门 构成 的 电路 ， 用 于 对 信 
息 电流 进行 操作 。 


1.3 计数 


正确 计数 至 关 重 要 。 在 处 理 与 计算 有 关 的 问题 时 ， 必 须 多 次 执行 计数 操 
E. O 本 节 涉 及 的 数学 知识 较 前 几 节 更 为 复杂 ， 但 读者 无 须 紧张 。 有 些 
人 认为 自己 不 擅长 数学 ， 因 此 难以 成 为 一 名 优秀 的 程序 员 。 事 实 也 不 尽 
然 一 一 我 的 高 中 数学 考试 没有 及 格 ， 后 来 也 拿 到 了 计算 机 科学 的 硕士 学 
位 。 成 为 一 名 优秀 程序 员 所 需 的 数学 ， 与 一 般 的 数学 考试 有 所 不 同 。 


是 业 之 后 ， 所 学 的 各 种 公 却 与 逐步 推导 过 程 都 会 逐 湖 遗 扎 ， 需 要 时 在 因 
竺 网 上 进行 搜索 即 可 。 计 算 并 非 必须 依 徘 笔 和 纸 才 能 进行 ， 直 和 客 对 于 优 
芳 的 程序 员 而 言 必 不 可 少 ， 学 习 计 数 问 题 将 进一步 增强 这 种 直觉 。 接 下 
来 将 逐一 讨论 乘法 、 排 列 、 组 合 、 求 和 等 一 系列 数学 工具 。 


1.3.1 乘法 


如 琳 一 个 事件 以 n 种 不 同 的 方式 发 生 ， 男 一 个 事件 以 m 种 不 同 的 方 却 
发 生 ， 那 么 两 个 事件 可 能 以 nxm 种 不 同 的 方式 发 生 。 举 例如 下 。 


密码 破译 万 PIN 码 由 两 个 数字 与 一 个 字母 组 成 ， 每 次 需要 
1 秒 的 时 间 进 行 输入 。 在 最 坏 的 情况 下 ， 需 要 多 久 才 能 破译 
PIN 码 ? 





D 2016 年 ， 研 究 人 员 制 造 出 1 纳米 级 别 的 晶体 管 。 金 原子 的 直径 为 0.15 纳米 。 
© 计数 与 逻辑 属于 离散 数学 ， 它 是 计算 机 科学 的 一 个 重要 领域 。 
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两 个 数字 有 100 种 搭配 方式 (00 到 99)， 一 个 字母 有 26 种 搭配 方式 
(A 到 Z)， 因 此 共有 100x26 = 2600 种 可 能 的 PIN 码 。 在 最 坏 的 情况 
下 ， 我 们 必须 党 试 每 一 个 PIN 人 码 ， 直 至 找 出 正确 的 密码 。 换 言 之 ， 需 要 
人 花费 2600 秒 (43 分 钟 ) 才能 破译 密码 。 


APERE 有 23 名 候选 者 布 望 如 入 你 的 团队 ， 你 采用 抛 硬币 
的 方式 决定 是 否 录用 他 们 。 对 于 每 个 候选 者 ， 如 果 抛 出 的 硬币 
正面 朝 上 ， 则 录用 他 。 那 么 一 共存 在 多 少 种 可 能 的 团队 配置 ? 


录用 他 们 之 前 ， 唯 一 的 团队 配置 就 古 你 目 己 一 人 ; 每 次 抛 出 硬币 后 ， 可 
能 的 配置 数量 将 增加 一 倍 。 由 于 必须 进行 23 次 抛 硬币 操作 ， 团 队 配 置 
的 数量 为 2 的 23 次 万 : 





2x2x...x2=2” =8 388 608 
— 
23 次 


请 注意 ， 其 中 一 种 配置 仍然 是 你 自己 。 


1.3.2 ”排列 


对 于 nn 个 项 ， 存 在 n 的 阶乘 Lut) 种 排序 方式 。 阶 乘 呈 爆炸 性 增长 ， 即 
便 征 很 小 的 革 值 ， 阶 乘 的 结 末 也 相当 惊人 。 如 东 读 者 不 熟悉 阶乘 ， 这 里 
给 出 其 定义 如 下 : 


nl=nx(n—l)x(n—2)x:……x2x1 


不 难看 出 ，n 个 项 共有 nl 种 排序 方式 。 那 么 在 n 个 项 中 ， 选 择 第 一 项 有 
多 少 种 方式 ? 选择 第 一 项 之 后 ， 选 择 第 二 项 有 多 少 种 方式 ?” 选择 第 二 项 
之 后 ， 选 择 第 三 项 有 多 少 种 方式 ?请 读者 思 竹 这 个 问题 ， 之 后 我 们 将 讨 
论 更 多 的 示例 。™ 


旅行 推销 员 晤 ”卡车 公司 为 15 座 城 市 送 贷 ， 我们 希望 了 解 哪 
种 路 线 安 排 可 以 最 大 限度 减少 耗 油 量 。 如 果 计 算 一 条 路 线 的 长 
度 需 要 工 毫 秒 ， 那 么 计算 所 有 可 能 路 线 的 长 度 需 要 多 久 ? 


O 根据 惯例 ，0!= 1， 即 对 0 个 项 进行 排序 ， 存 在 一 种 方式 。 
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15 座 城市 的 每 种 排列 都 是 一 条 不 同 的 路 线 。 阶 乘 是 不 同 排列 的 数量 ， 
因此 共有 15$! = 1$Sx14x…x1<=1.3 万 亿 条 路 线 。 由 此 可 知 ， 需 要 1.3 
HiLÆ ( 约 15 R) 才能 计算 出 所 有 路 线 的 长 度 。 如 果 城 市 的 数量 增 
加 到 20 座 ， 则 需要 7.7 万 年 才能 完成 计算 。 

会 贵 的 曲调 著 ” 一 位 音乐 家 正在 研究 一 种 包括 13 个 不 同音 符 

的 音阶 ， 她 希望 你 找 出 所 有 仅 使 用 6 个 音符 的 旋律 。 每 个 音 

符 在 每 种 旋律 中 都 要 播放 一 次 ， 每 种 使 用 6 个 音符 的 旋律 需要 

1 秒 钟 进行 播放 。 那 么 播放 这 位 音乐 家 所 要 求 的 全 部 旋律 需要 

多 久 ? 
在 13 个 音符 中 ， 我 们 需要 计算 其 中 6 个 音符 的 排列 。 为 忽略 未 使 用 音 
符 的 排列 ， 必 须 在 第 6 个 因子 后 停止 阶乘 计算 。 形 式 上 ， 
个 可 能 项 中 m 种 可 能 排列 的 数量 。 在 本 例 中 : 








n! 是 
(n-m)! 


13! 13x12x11x10x9x8x7! 
(13-6)! 7! 
=13x12x11x10x9x8 
6 个 因子 
=1 235 520 种 旋律 





可 以 看 到 ， 共 有 超过 120 万 种 播放 时 间 为 1 秒 的 旋律 。 换 言 之 ， 需 要 
343 个 小 时 才能 将 所 有 旋律 听 完 一 一 最 好 说 服 音乐 家 通过 其 他 方式 寻找 
完美 的 旋律 。 





1.3.3 ”具有 相同 项 的 排列 


如 琳 某 些 项 相同 ， 那 么 对 nn 个 项 而 言 ， 排 序 方式 的 数量 要 少 于 nl 种 。 
交换 位 置 的 相同 项 不 应 和 被 计 作 不 同 的 排列 。 


在 一 个 包含 n 个 项 的 序列 中 ， 如 果 有 7 个 项 相同 ， 则 存在 xr! 种 重新 排序 
相同 项 的 方式 。 因 此 ,nl 将 对 每 个 不 同 的 排列 进行 r! 次 计数 。 为 获取 
不 同 排列 的 数量 ， 需 要 将 nl 与 r! 相 除 。 以 字母 “CODE ENERGY” 为 
例 ， 不 同 排列 的 数量 为 1013! 种 。 
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DNA 研究 过 ”一 位 生物 学 家 正在 研究 一 种 与 遗传 疾病 有 关 的 
DNA 片段 。 它 由 23 个 碱 基 对 构成 ， 其 中 9 个 必须 为 A-T， 另 
外 14 个 必须 为 G-C。 这 位 生物 学 家 希望 为 所 有 具有 这 些 碱 基 
对 数目 的 DNA 片段 运行 模拟 任务 ， 那 么 所 需 的 模拟 任务 总 数 
是 多 少 ? 
我 们 首先 计算 23 个 碱 基 对 所 有 可 能 的 排列 ， 然 后 将 结果 与 9 个 重复 的 
A-T 以 及 14 个 重复 的 G-C 碱 基 对 相 除 ， 从 而 得 到 碱 基 对 排列 的 数量 : 
23! 
(9x14) 


ERRER. Au le E A0 Il EIS COM, WST EAR 
SE 


=817 190 








对 于 每 一 个 23 个 碱 基 对 的 序列 ， 存 在 2” 种 不 同 的 取向 构 型 ， 因 此 序列 
已 数 为 : 


二 者 有 所 不 同 





817 190 x2” >27 HÁL 


这 只 是 一 个 已 知 分 布 的 23 AWURE FEA ESAE, whia 
制 DNA 来 目 猪 圆 环 病毒 ， 包 括 1800 个 碱 基 对 ! 从 技术 角度 看 ，DNA 
编码 与 生命 确实 令 人 叹为观止 。 一 个 难以 置信 的 事实 古 ， 人 类 DNA 约 
有 30 亿 个 碱 基 对 ， 在 人 体 的 3 万 亿 个 细胞 中 复制 。 


134 H6 


请 读者 想象 一 副 包含 所 有 黑 桃 花色 的 扑克 牌 合共 13 张 )， 那 么 向 对 
FR 6 张 牌 有 多 少 种 方式 ”在 13 个 可 能 项 中 找 出 6 种 排列 ， 其 数量 为 
36 种 。 由 于 6 张 牌 的 顺序 无 关 紧要 ， 我 们 必须 将 结果 与 6 相 除 
从 而 得 到 符合 要 求 的 组 合 数 量 。 
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13! 


— ”=1716 
6!13-0)! 


ml RMA n Tan Tamtam (remm, 


n 
m 
Hl n! 
人 ml!l(n—m)! 


上 述 二 项 式 读 作 “n 选 m 。 
皇后 问题 世 ”有 一 副 空 棋盘 以 及 8 个 后 ， 后 可 以 放 在 棋盘 的 任 
何人 位置， 那么 后 共有 多 少 种 不 同 的 放置 万 式 ? 


国际 象棋 棋盘 由 64 个 (8x8 方 格 的 网 格 ) 组 成 。 从 64 个 可 用 的 方 格 中 
选择 8 个 ， 共 有 是 ~ 44 亿 种 方式 。 


1.3.5 KN 


计数 时 经 并 需要 对 序列 求 和 ， 序 列 和 采用 求 和 符号 (>) 表示 。 在 表达 
式 中 对 i 的 每 个 值 求 和 表示 为 : 


Lë 
> 的 表达 式 
GH 
例如 ， 对 前 5 个 奇数 求 和 可 以 写作 : 
SC =1+3+5+7+9 


采用 0、1、2、3、4 替换 i;， 从 而 得 到 1、3、5、7、9。 类 似 地 ， 对 前 nn 
个 目 然 数 求 和 可 以 写作 : 


KEIER =le 
i=l 
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天 才 数学 家 高 斯 在 10 岁 时 ， 老 师 曾 要 求 他 对 自然 数 求 和 。 高 斯 没有 采 
用 逐一 相 加 的 方法 ， 而 是 发 现 了 一 个 巧妙 的 计 窒 : 





5; _ n(n+l1) 
本 2 





读者 能 猜 出 高 斯 是 如 何 发 现 上 述 公式 的 吗 ? 相 关 解释 请 参见 附录 。 接 下 
来 ， 我 们 讨论 如 何 利用 它 来 解决 实际 问题 。 


廉价 机 票 肝 你 需要 在 今后 30 天 内 随时 飞 往 纽约 ， 而 机 票 价 格 
会 根据 出 发 日 期 与 返程 日 期 发 生 无 法 预测 的 变化 。 那 么 必须 查 
看 多 少 对 出 发 /返程 日 期 才能 找到 今后 30 天 内 往返 纽约 的 最 
便宜 的 机 票 ? 
只 要 返程 日 期 与 出 发 日 期 为 同一 天 或 晚 于 出 发 日 期 ， 那 么 从 今天 (第 
1 天) 到 最 后 一 天 (第 30 天 ) 之 间 的 任何 出 发 /返程 日 期 都 是 有 效 的 。 
因此 ， 第 1 天 有 30 对 有 效 的 出 发 /返程 日 期 ， 第 2 天 有 29 对， 第 3 天 
有 28 对 ， 以 此 类 推 ， 第 30 天 只 有 一 对 有 效 的 出 发 /返程 日 期 。 换 言 
之 ， 总 共 需 要 考虑 30+29+…+2+1 对 出 发 /返程 日 期 。 我 们 可 以 将 其 写 
30 
作 27 ， 并 利用 高 斯 发 现 的 诀窍 计 算 它 的 值 。 


d. 20201 
Í 





=465 对 出 发 /返程 日 期 


i=l 


也 可 以 利用 组 合 来 解决 这 个 问题 。 从 30 天 中 选择 两 天 ， 顺 序 无 关 紧 
要 : 较 早 的 一 天 作为 出 发 日 期 较 晚 的 一 天 作为 返程 日 期 由 此 可 


但 | ]-435 。 请 注意 ， 必 须 将 出 发 日期 与 返程 日 期 为 同一 天 的 情 
况 考 虑 在 内 。 这 样 的 组 合共 有 30 种 ， 因 此 出 发 /返程 日 期 的 总 数 为 
30 

REEL 对 。 
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1.4 概率 


随机 性 原则 有 助 于 我 们 理解 博彩 、 预 报 天 气 或 设计 低 风 险 的 备份 系统 。 
这 些 原则 并 不 复杂 ， 却 被 大 多 数 人 所 误解 。 


int get RandomNumber() 


return H A REFAH 
J| AEA Äh 





? 


1-8 “随机 数 ”( 取 自 http:/xkcd.com ) 


我 们 首先 利用 计数 来 计算 赔 率 ， 然 后 学 习 如 何 使 用 不 同 的 事件 类 型 来 解 
决 占 题 ， 最 后 解释 赌 什 为 何 会 输 得 精光 。 


1.4.1 XARITA 


—A ie ALARE 6 种 可 能 的 结果 ， 即 点 数 "3 Aa 6. WH, 
掷 出 点 数 4 的 概率 为 16。 那 么 掷 出 奇数 点 数 的 概率 又 如 何 呢 ? 由 于 和 奇 
数 点 数 有 3 个 (点数 1、3、5)， 所 以 概率 为 3/6 = 1/2。 形 式 上 ,一 个 事 
件 发 生 的 概率 为 : 


_ 事 件 发 生 的 次 数 
可 能 的 结果 数量 


aR TAPETE N A ERREA ER, MERA RENAE RAR EAI 
率 相 同 ， 上 述 表 达 式 成 立 。 
团队 建设 ( 续 ) 恰 有 23 名 候选 者 希望 加 入 你 的 团队 ， 你 采 
用 抛 硬币 的 方式 决定 是 否 录 用 他 们 。 对 于 每 个 候选 者 ， 如 果 扫 
出 的 硬币 正面 朝 上 ， 则 录用 他 。 那 么 没有 录用 任何 候选 者 的 概 
率 有 多 大 ? 


之 前 的 示例 曾经 讨论 过 ， 共 有 22 = 8 388 608 种 可 能 的 团队 配置 。 没 有 
录用 任何 候选 者 的 唯一 方式 是 抛 出 的 硬币 连续 23 次 正面 朝 下 ， 因 此 这 


P( 事 件 ) 
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种 情况 发 生 的 概率 是 P( 无 人 录用 )=1/8 388 608) 一 一 客观 地 说 ， 商 业 航 
班 失事 的 概率 约 为 五 百 万 分 之 一 。 


1.4.2 ”独立 事件 


所 硬币 与 括 人 般 子 时 ， 硬 币 正面 彰 上 与 搬出 点 数 6 的 概率 为 12 x 1/6 = 
1/12 = 0.08, BH 8%。 如 霖 一 个 事件 的 结 来 不 会 对 为 一 个 事件 的 结 采 产生 
影 啊 ， 则 称 二 者 相互 独立 。 两 个 独立 事件 发 生 的 概率 是 它们 各 目 概 率 有 的 
RIR, 


数据 备份 图 我 们 需要 将 数据 保存 一 年 。 一 种 磁盘 损坏 的 概 
率 是 十 亿 分 之 一 ， 另 一 种 磁盘 的 价格 只 有 前 者 的 20%， 但 损 
坏 的 概 座 为 两 千 分 之 一 。 那 么 应 该 选择 昂贵 的 磁盘 还 是 便宜 
的 磁盘 ? 


如 采 使 用 3 张 便宜 的 磁盘 ， 那 么 仅 当 所 有 磁盘 都 损坏 时 才 会 丢失 数据 。 
这 种 情况 发 生 的 概率 为 (1/2000) = 1/8 000 000 000。 与 昂贵 的 磁盘 相 比 ， 
3 张 便 宜 磁 盘 提 供 的 高 元 余 度 能 降低 数据 丢失 的 风险 ， 而 价格 只 有 昂贵 
KS ID 60%., 


1.4.3 BEES 


STT nl REIH (Gu 4 7 rarär ën, DW, zm AA A 
ARRESTA Mentee D /16+1/2 = 2/3。 如 果 两 个 事件 不 可 能 同时 
发 生 ， 则 称 二 者 互 斥 。 如 采 希 望 任 一 互 斥 事件 发 生 ， 将 它们 各 目的 概率 
相 加 即 可 。 


订阅 选项 圈 网 站 提供 和 免费、 基本、 高 级 等 3 种 订阅 计划 。 已 
知 一 名 随机 的 新 用 户 有 70% 的 概率 选择 免费 计划 ，20% 的 概 
率 选 择 基本 计划 ，10% 的 概率 选择 融 级 计划 。 那 么 新 用 户 注 册 
付费 计划 的 可 能 性 有 多 大 ? 


在 本 例 中 ， 事 件 是 互 斥 的 ， 即 用 户 无 法 同时 选择 基本 计划 与 高 级 计划 。 
用 户 付 费 的 概率 为 0.2 + 0.1 = 0.3, 
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1.4.4 ”对 立 事件 


骨 子 不 可 能 同时 毛 出 点 数 3 的 倍数 (点数 3 和 6) 与 无 法 被 3 整除 的 点 
数 ， 但 必然 会 抢 出 其 中 之 一 。 由 于 掷 出 点 数 3 的 倍数 的 概率 为 2/6 = 1/3， 
掷 出 无 法 被 3 整除 的 点 数 的 概率 为 1-13 = 2/3。 如 果 两 个 互 斥 事件 涵盖 
所 有 可 能 的 结果 ， 则 称 二 者 对 立 。 因 此 ， 对 立 事件 的 概率 之 和 为 100%. 


EDI KE ”城堡 由 5 座 炮 塔 保 护 ， 每 座 炮塔 有 20% äm A 
入 侵 者 到 达 城 堡 前 消灭 它们 。 那 么 消灭 入 侵 者 的 概率 有 多 大 ? 


读者 是 否认 为 炮塔 击 中 入 侵 者 的 概率 为 0.2 + 0.2+0.2+0.2+0.2=1 
(ak 100%) ? 错 ! 不 要 将 各 个 独立 事件 的 概率 相 加 ， 这 是 一 个 和 常见 的 错 
误 。 本 例 需 要 应 用 两 次 对 立 事件 。 


口 20% 的 命中 概率 与 80% 的 未 命中 概率 互 为 对 立 事件 ， 因 此 所 有 炮塔 
均 未 命中 的 概率 为 0.8- = 0.33。 

D 事件 “所 有 炮塔 均 未 命中 ”与 “至 少 有 一 座 炮塔 命中 ” 互 为 对 立 事件 ， 
因此 消灭 入 侵 者 的 概率 为 1-0.33 = 0.67。 





1.4.5 TARIR 


ARKA Ep A EHA 10 次 ， 且 10 次 均 为 正面 朝 上 ， 那 么 在 第 
11 次 抛 出 硬币 时 ， 是 否 正面 朝 下 的 概率 更 大 一 些 呢 ?再 者 ， 购 买 彩票 
时 选择 数字 1 到 6， 是 否 比 选择 均匀 间隔 的 数字 更 不 容易 赢 呢 ? 


请 记 住 ， 不 要 成 为 财 徙 请 误 的 受害 者 。 过 去 的 事件 永 延 不 会 影响 独立 事 
件 的 结 末 一 一 永远 不 会 。 在 真正 的 随机 彩票 抽奖 中 ， 选 择 任何 指定 数字 
歼 奖 的 概率 与 选择 其 他 数字 完全 相同 。 不 存在 所 谓 的 “交规 则 "， 使 得 
之 前 不 经 党 选择 的 数字 在 今后 会 被 更 频 葵 地 选择 。 


1.4.6 ”高 级 概率 


概率 寂 及 有 的 内 容 相 当 广 泛 ， 本 廊 鸭 介绍 难免 挂 一 漏 万 。 在 处 理 复 洒 问 题 
时 ， 务 必 记 得 寻找 更 多 工具 。 举 例如 下 。 
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团队 建设 ( 再 续 ) E 有 23 名 候选 者 希望 加 入 你 的 团队 ， 你 
采用 抛 硬 币 的 方式 决定 是 否 录 用 他 们 。 对 于 每 个 候选 者 ， 如 果 
抛 出 的 硬币 正面 朝 上 ， 则 录用 他 。 那 么 录用 7 名 或 更 少 候 选 者 
的 概率 有 多 大 ? 


没 错 ， 这 个 问题 并 不 简单 。 利 用 Google 进行 搜索 ， 最 终 将 引 至 “二 项 分 
布 "。 读 者 可 以 在 Wolfram Alpha 中 输入 “B(23,1/2) < 7” 来 观察 结果 。 


1.5 人 小结 


这 一 章 讨论 了 与 求解 问题 密切 相关 的 一 些 知识 ， 但 并 未 涉及 任何 实际 的 
程序 代码 。1.1 节 解 释 了 将 重要 内 容 写 下 来 的 原因 和 方法 。 我 们 为 需要 
解决 的 问题 建 模 ， 并 将 概念 工具 应 用 于 所 创建 的 模型 中 。1.2 节 讨 论 了 
布尔 代数 、 真 值 表 等 处 理 逻 辑 问题 所 需 的 工具 ， 


1.3 市 讨论 了 计数 ， 它 在 计算 各 种 问题 的 可 能 性 与 配置 时 发 挥 了 重要 作 
用 。 快 速 进行 粗略 估算 有 助 于 判断 计算 是否 可 行 ， 刚 入 行 的 程序 员 往 往 
会 瀛 费时 间 分 析 太 多 的 情况 。1.4 慷 解 释 了 概率 计算 的 基本 规则 。 在 这 
个 美妙 但 不 确定 的 世界 中 ， 概 率 对 于 解决 问题 至 关 重 要 。 

在 此 基础 上 ， 我 们 简要 介绍 了 学 术 界 称 为 离散 数学 的 许多 重要 知识 点 。 
读者 可 以 从 下 面 列 出 的 参 芳 资料 或 维基 百科 中 找到 更 多 有 趣 的 定理 。 例 
如 ， 根 据 “ 铝 嘛 原理 ， 不 难 证 明 纽约 至 少 有 两 个 人 的 头发 数量 一 样 多 。 
这 一 和 草 讨 论 的 部 分 内 容 与 第 2 草 密 切 相 关 。 第 2 草 将 介绍 计算 机 科学 中 
了 最 重要 的 概念 一 一 复杂 度 。 





口 《 离 散 数 学 及 其 应 用 (第 7 版 )》，Kenneth H. Rosen 著 
口 周 以 真 教 授 关 于 计算 思维 的 幻灯 片 


第 2 草 


SZ 


几乎 所 有 计算 都 能 采用 各 种 方法 完成 ， 选 择 可 以 最 大 限度 减少 
计算 所 需 时 间 的 方法 至 关 重 要 ，。 
一 一 埃 达 . 洛 夫 莱 斯 0 


整理 26 张 洗 过 的 扑克 牌 需 要 多 和 信 ? 整理 52 张 牌 的 时 间 是 否 两 倍 于 此 ? 
整理 1000 副 牌 又 要 花 多 长 时 间 ? 理 牌 所 用 的 方法 是 固有 的 。 


方法 是 实现 目标 所 需 的 一 系列 明确 指令 ， 而 算法 是 包含 一 系列 有 限 运 算 
的 方法 。 例 如 ， 理 牌 算法 就 是 一 种 方法 ， 它 指定 了 按 化 色 与 点 数 对 26 
张 牌 排序 所 需 的 运算 。 


运算 越 少 ， 所 需 的 计算 能 力 越 少 。 如 采 布 望 缩 得 求解 时 间 ， 就 要 监控 算 
法 的 运算 次 数 。 当 输入 规模 增长 时 ， 许 多 算法 的 运算 次 数 将 迅速 增加 。 
仍 以 理 牌 算法 为 例 ， 利 用 它 排 序 26 张 牌 无 须 进行 太 多 运算 ， 但 排序 52 
张 牌 所 需 的 运算 量 将 4 倍 于 此 。 

在 问题 规模 增长 时 ， 为 避免 算法 的 性 能 下 降 ， 我 们 需要 研究 其 时 间 复 杂 
度 。 这 一 章 将 讨论 以 下 内 容 : 

S 计算 并 解释 时 间 复 杂 度 

od 采用 华丽 的 大 O 符号 表示 时 间 复 杂 度 的 增长 

ww 避免 使 用 指数 算法 

BO 确保 充足 的 计算 机 内 存 

不 过 ， 我 们 首先 需要 定义 时 间 复 杂 度 。 

















OD Rik RRM (1815 一 1852)， 英 国 数学 家 与 作家 ， 著 名 诗人 拜 伦 之 女 ， 被 公认 
为 历史 上 第 一 位 计算 机 程序 员 。 为 纪念 她 的 贡献 ， 美 国 国防 部 于 1980 年 将 一 门 高 
级 程序 设计 语言 命名 为 Ada。 一 一 译 者 注 
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时 间 复杂 度 写作 Tn)， 它 给 出 了 算法 在 处 理 规模 为 n 的 输入 时 所 执行 的 
运算 次 数 。 也 可 将 算法 的 时 间 复 杂 度 视 为 算法 的 运行 成 本 。 如 果 理 牌 算 
法 的 时 间 复杂 度 为 TCD = 号 ， 那 么 可 以 做 出 如 下 预测 ， 当 一 副 牌 的 数量 
秋香 时， 排序 所 用 的 时 间 为 Zen, 


好 处 着想， 坏处 准备 


整理 一 扒 儿 乎 理 过 的 牌 ， 速 度 不 是 应 该 更 快 吗 ?” 输入 规模 并 非 影响 算法 
运算 次 数 的 唯一 因素 。 对 于 相同 的 n 值 ， 算法 可 以 具有 不 同 的 T(n) 值 ， 
我 们 需要 芳 虑 以 下 3 种 情况 。 


D 最 好 情况 : 对 于 任意 的 输入 规模 ， 算 法 所 需 的 最 少 运 算 次 数 。 在 排 
序 中 ， 如 琳 输 入 已 完成 排序 就 会 出 现 这 种 情况 。 

D 最 坏 情 况 : 对 于 任意 的 输入 规模 ， 算 法 所 需 的 最 多 运算 次 数 。 在 许 
多 排序 算法 中 ， 如 末 输 入 以 倒序 给 出 就 会 出 现 这 种 情况 。 

DO 平均 情况 : 对 于 典型 的 输入 规模 ， 算 法 所 需 的 平均 运算 次 数 。 在 排 
序 中 ， 通 第 会 考虑 随机 顺序 的 输入 。 


一 般 而 言 ， 取 坏 情况 最 为 重要 ， 它 提供 了 一 种 可 以 信赖 的 保证 。 如 下 不 
做 特别 说 明 ， 我 们 总 是 芳 虑 最 坏 情况 。 下 面 开 始 实际 分 析 最 坏 情 况 。 





RI 我 不 别 并 ， 有 一 个 简单 ”| 现在 再 次 将 时 | 了 0 入 过 去 了 ， 除 了 加 们 时 
kki 的 诀窍 . 先 做 出 最 | 间 加 信 ， 并 加 | RART AA 
算 项 目 所 现实 的 合计， 再 将 | 上 5 分 钟 。 接 | 何 进 展 ， 那 么 永远 也 做 不 
需 的 时 间 。|| 时 间 加 信 。 下 来 ， 第 三 次 | 完 ! EI 

将 时 间 训 售 。 





2-1 “FHEAE” (WÄ https://xkcd.com/) 
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2.1 ”时间 计 算 


假设 输入 规模 为 x， 借 由 计算 输入 所 需 的 基本 运算 次 数 ， 就 能 找 出 算法 
的 时 间 复 杂 度 。 我 们 通过 选择 排序 (一 种 使 用 余人 套 循 环 的 算法 ) 加 以 说 
明 。 如 下 所 示 ， 外 层 for 循环 负责 更 新 正在 排序 的 当前 位 置 ， 而 内 层 
for 循环 负责 选择 处 于 当前 位 置 的 项 。” 
function selection_sort(list) 
for current e 1 .. list. length = 1 
smallest ¢ current 
for 1 e current + 1 ~ List, Length 
if list[i] < list[smallest] 
smallest e"? 
list.swap_items(current, smallest) 


如 琳 列 表 包 括 n 项 ， 我 们 考虑 在 最 坏 情况 下 会 发 生 什么 。 外 层 循 环 将 运 
行 n-1 次 ， 每 次 执行 两 项 操作 (分 别 为 赋值 与 交换 )， 共 计 2n-2 次 操 
作 。 内 层 人 循环 首先 运行 n-1 次 ， 然 后 运行 n-2 次 、n-3 次 ， 以 此 类 推 。 
根据 第 1 章 的 讨论 ， 对 这 些 类 型 的 序列 求 和 : ” 


外 层 循 环 一 共 运 行 n-1 次 


内 层 循环 的 运行 次 数 =7=-1] 十 N=2 E EE E 
第 1 次 外 层 循 环 第 2 次 外 层 循 环 
Ei um ow-n 
i 2 2 





在 最 坏 情 况 下 ，if 条 件 总 是 满足 的 。 换 言 之 ， 内 层 循环 将 执行 (n-n)/2 
次 比较 操作 与 赋值 操作 ， 共 计 n-n 次 操作 。 因 此 ， 算 法 的 成 本 为 外 层 
循环 与 内 层 循环 的 操作 次 数 之 和 ， 即 2n-2 与 nn 之 和 。 由 此 得 到 选择 
排序 算法 的 时 间 复 杂 度 : 


T(n)=n +n-2 





O 为 理解 选择 排序 算法 ， 请 将 程序 写 下 来 ， 给 出 一 个 小 的 输入 并 观察 运行 结果 。 
D 同 亿 13 市 给 出 的 求 和 公式 ; > AUV2。 
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如 琳 列 表 大 小 为 n= 8， 那 么 当 n 倍增 后 ， 排 序 时 间 将 乘 以 : 


2 
TU6) 16° +16-2 Se 
TE) 8 48=2 
如 果 n 再 次 倍增 ,排序 时 间 将 乘 以 3.90。 如 果 n 继续 倍增 3 次 ， 排 序 时 
间 将 依次 乘 以 3.94、3.97 与 3.98。 读 者 是 否 注意 到 这 个 数字 越 来 越 接近 
4? 也 就 是 说 ， 对 200 万 个 项 排序 时 ， 所 需 时 间 是 对 100 万 个 项 排序 的 
SCH 


理解 增长 


假设 算法 的 输入 规模 极 大 ， 且 将 继续 增加 。 在 预测 执行 时 间 将 如 何 增长 
时 ， 并 不 需要 求 出 TO 的 所 有 项 ， 我 们 可 以 通过 增长 最 快 的 项 〈 称 为 
EI) 对 T) 进行 近似 。 


索引 卡片 因 昨天 你 打 翻 了 一 金 索引 卡片 ， 于 是 利用 选择 排序 
算法 耗 时 两 小 时 进行 整理 。 今 天 你 又 打 翻 了 10 EFH, MA 
需要 多 长 时 间 进 行 整理 ? 


根据 前 面 的 讨论 可 知 ， 选 择 排序 算法 的 时 间 复 杂 度 为 T(n) =n +n -2。 
由 于 增长 最 快 的 项 是 nw， 可 以 认为 T(n) 守 nn。 假设 一 盒 中 有 nn 张 卡 片 ， 
WE 


TOn) On)? um 
T(n) n’ 

换言之 ， 需 要 花费 大 约 100 x (2 小 时 ) = 200 小 时 来 整理 卡片 ! 那么 ， 

换 用 不 同 的 排序 方法 能 否 缩短 整理 时 间 呢 ?例如 ， 冒 泡 排 序 算法 的 时 间 

复杂 度 为 TOD) = 0.57 + 0.5n。 利 用 增长 最 快 的 项 对 T) 进行 近似 可 得 

T(m) z= 0.57, K: 





T07) ` 0.5x (107) 


=100 
T(n) 0.5xn? 
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可 以 看 到 ， 系 数 0.5 相互 抵消 。 也 就 是 说 ,希望 x +n 一 2 与 0.5n + 
0.5n 像 寺 一样 增长 并 非 易 事 。 那 么 ， 函 数 中 增长 最 快 的 项 是 如 何 忽略 
所 有 其 他 项 并 主导 增长 呢 ? 我 们 通过 示意 图 来 解释 这 个 问题 。 


LU IT 
III 


2-2 MEE n REK, vi n +n-2, 0.50 + 0.S7 越 来 越 接近 


2-2 以 不 同 的 缩放 比例 显示 了 两 个 时 间 复 杂 度 与 于 的 对 比 。 随 着 的 
值 越 来 越 大 ， 三 者 的 曲线 似乎 越 来 越 接近 。 实 际 上 ， 可 以 用 任何 数字 符 
H T(n) — en +wn+" 中 的 方块 ， 其 增长 仍然 类 似 于 i。 

请 记 住 ， 如 琳 不 同 函 数 中 增长 最 快 的 项 相同 ， 它 们 的 曲线 就 会 越 来 越 接 
近 。 一 个 呈 线 性 增长 的 函数 (n) 的 曲线 永远 不 会 越 来 越 接 近 于 一 个 呈 
二 次 增长 的 函数 (nw*)， 它 的 曲线 也 永远 不 会 越 来 越 接近 于 一 个 哇 三 次 
增长 的 函数 (ui), 

因此 ， 如 采 输 入 极 大 ， 那 么 具有 线性 成 本 的 算法 在 性 能 上 优 于 具有 二 次 
成 本 的 算法 ， 而 后 者 在 性 能 上 优 于 具有 三 次 成 本 的 算法 。 理 解 这 一 所 
后 ， 学 习 下 一 市 将 多 如 反 黎 : 我 们 将 讨论 利用 华丽 的 大 符 志 来 表示 


复杂 度 。 











2.2 KOS 


增长 的 程度 通 第 用 一 种 特殊 的 符号 表示 ， 这 就 古 大 O 符号。 如 采 增 长 
最 快 的 项 为 2”( 或 更 弱 )， 则 函数 的 时 间 复 杂 度 为 0(2”)， 对 于 呈 二 次 增 
长 (或 更 弱 ) 的 国 数 ， 其 时 间 复 杂 度 为 ON; 对 于 呈 线 性 增长 (或 更 
弱 ) 的 国 数 ， 其 时 间 复 杂 度 为 O(n);， 以 此 类 推 。 大 0 符号 用 于 表示 最 
坏 情况 下 算法 成 本 函数 的 主 项 ， 它 是 时 间 复 杂 度 的 标准 表示 法 。 





Se n? / nlogn n 


logn 


图 2-3 篆 见 函数 的 上 时间 复杂 度 


选择 排序 与 冒 泡 排 序 算法 的 时 间 复 杂 度 均 为 Om)， 但 我 们 很 快 会 发 现 ， 
使 用 时 间 复 杂 度 为 O(n log n) 的 算法 也 能 完成 同样 的 任务 。 对 于 Om 算 
法 ， 如 采 输 入 规模 增加 10 倍 ， 运 行 成 本 将 增加 100 倍 ， 而 对 于 O(n log n) 
算法 ， 如 东 输 入 规模 增加 10 倍 ， 运 行 成 本 只 会 增加 10 log10 = 34 倍 。 


当即 增加 到 100 DD. n 的 结果 为 1 DI, m n logn 的 结果 仅 为 600 万 。 
如 果 输 入 很 大 ， 那 么 On 算法 可 能 需要 几 年 才能 得 到 结果 ， 而 使 用 
Omn log n 算法 儿 分 钟 即 可 运行 完毕 。 有 鉴于 此 ， 如 果 所 设计 的 系统 需 
要 处 理 极 大 的 输入 ， 那 么 时 间 复 杂 度 分 析 必 不 可 少 。 


在 计算 系统 的 设计 中 ， 预 测 最 频 营 的 运算 至 关 重 要 ， 然 后 可 以 对 执行 这 
些 运算 的 不 同 算法 的 大 O 成 本 进行 比较 。” 此 外 ， 大 多 数 算法 只 适用 于 





O 求解 各 种 常见 问题 所 用 的 算法 ， 其 大 O 复杂 度 请 参见 http://bigocheatsheet.com/。 


2.3 指数 | 29 


特定 的 输入 结构 。 如 林 提 前 选择 算法 ， 融 能 相应 地 构造 输入 数据 。 


无 论 输入 规模 大 小 如 何 ， 某 些 算法 的 时 间 复 杂 度 始终 为 第 数 时 间 O(1)。 
例如 ， 判 断 三 进 制 数 的 否 偶 性 时 ， 只 需 观察 最 后 一 位 数字 的 奇偶 性 即 
可 。 接 下 来 的 草 菠 将 介绍 更 多 神奇 的 O(1) 算法 ， 但 我 们 首先 来 讨论 一 
下 那些 不 太 神 奇 的 算法 。 





2.3 指数 


时 间 复 杂 度 为 O2 的 算法 称 为 指数 时 间 算 法 。 在 图 2-3 中 ， 二 次 函数 
n 与 指数 函数 >" 的 曲线 似乎 并 无 太 大 不 同 。 但 随 着 的 增 大 ， 指 数 函 
数 的 增长 显然 远 超 二 次 函数 〈( 见 图 2-4)。 





nlogn 


图 2-4 不 同 函数 的 时 间 复 杂 度 (示意 图 放大 后 ) ; 线性 函数 与 对 数 函 数 的 曲线 
增长 过 小 ， 图 中 已 不 可 见 


由 于 指数 时 间 的 增长 是 如 此 之 快 ， 我 们 认为 指数 时 间 算 法 “无 法 运行 ”。 
它们 适用 的 输入 类 型 凤 毛 议 角 ， 且 除非 输入 规模 很 小 ， 否 则 算法 将 消耗 
大 量 的 计算 能 力 ， 即 便 优 化 代码 的 各 个 环节 或 使 用 超级 计算 机 也 无 济 于 
事 。 指 数 总 是 呈 压 倒 性 增长 ， 以 至 于 指数 时 间 算 法 不 具备 可 行 性 。 

为 说 明 指 数 增长 的 爆炸 性 ， 我 们 进一步 放大 示意 图 并 调整 数字 ( 见 图 
2-5)。 指 数 函 数 >" 的 底数 从 2 降 至 1.5， 其 增长 除 以 1000;， 多 项 式 n 的 
指数 从 2 增 至 3， 其 增长 乘 以 1000。 








0.001(1.5y 1000 a 





2-5 ”多项式 的 增长 无 法 超过 指数 函数 ， 在 这 个 缩放 比例 上 ， 即 便 是 n log 7 
曲线 的 增长 也 因 过 小 而 不 可 见 


采 些 算法 的 性 能 甚至 比 指数 时 间 算 法 更 差 。 以 阶乘 时 间 算 法 为 例 ， 其 时 
间 复 杂 度 为 O(n!)。 尽 省 指数 时 间 算 法 与 阶乘 时 间 算 法 令 人 生 展 ， 但 我 
们 需要 利用 它们 解决 者 名 的 NP 完全 问题 ， 它 是 难度 最 大 的 一 类 计算 问 
题 。 第 3 草 将 讨论 大 干 重要 的 NP 完全 问题 。 就 目前 而 言 ， 请 记 住 这 一 
尽 : 如 采 读 者 能 首先 找 出 茶 个 NP 完全 辣 题 的 非 指数 算法 ， 将 获得 殉 雷 
数学 研究 所 颁发 的 100 万 美元 奖金 。~ 


了 解 所 要 处 理 的 问题 类 型 十 分 重要 。 如 采 已 知 该 问题 证 NP 完全 的 ， 那 
么 试图 找 出 最 优 解 无 异 于 绿 木 求 鱼 一 一 除非 读者 的 目标 是 顾 得 100 万 美 


元 奖金 。 








2.4 内存 计算 


即便 操作 的 执行 速度 可 以 无 限 快 ， 计 算 能 力也 是 有 限 的 。 在 执行 过 程 
中 ， 算 法 需要 存储 空间 来 跟踪 正在 进行 的 计算 。 这 需要 消耗 计算 机 内 
存 ， 它 并 非 无 限 的 资源 。 


O 现 已 证 明 ,， 任何 NP 完全 问题 的 非 指 数 算法 都 可 以 推广 到 所 有 NP 完全 问题 。 目 前 
尚 不 清楚 这 样 的 算法 是 否 存在 ， 因 此 如 琳 读 者 能 证 明 某 个 NP 完全 问题 无 法 采用 非 
间 数 算法 解决 ， 那 么 也 可 以 获得 100 万 美元 。 
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对 算法 所 需 存储 空间 的 量度 称 为 空间 复杂 度 。 空 间 复 杂 度 分 析 与 时 间 复 
杂 度 分 析 类 似 ， 区 别 在 于 它 的 研究 对 象 是 计算 机 内 存 而 非 计算 操 作 。 与 
处 理 时 间 复 杂 度 一 样 ， 我 们 将 讨论 空间 复杂 度 如 何 随 算法 输入 规模 的 增 
长 而 变化 。 


以 2.1 市 介绍 的 选择 排序 算法 为 例 ， 它 只 需要 一 组 固定 的 变量 作为 存储 
空间 。 由 于 变量 的 数量 不 依赖 于 输入 规模 ， 可 以 将 选择 排序 算法 的 空间 
复杂 度 记 作 O(1)。 换 言 之 ， 无 论 输入 规模 如 何 ， 这 种 算法 都 要 消耗 相 
同 的 计算 机 内 存 作为 存储 空间 。 


然而 ， 许 多 其 他 算法 所 需 的 存储 空间 会 随 着 输入 规模 的 增长 而 增长 。 某 
些 情况 下 ， 不 可 能 满足 算法 对 内 存 的 要 求 。 例 如 ， 无 法 找到 一 种 既 满 足 
时 间 复 杂 度 为 O(n log n)、 义 满足 空间 复 灯 度 为 O) 的 排序 算法 。 受 制 
于 计算 机 内 存 ， 我 们 有 时 不 得 不 做 出 权衡 。 如 有 果 内 存 较 小 ， 或 许 选择 时 
间 复 杂 度 为 OM 的 算法 才 是 上 策 ， 因 为 其 空间 复杂 度 为 0(1)。 在 接 下 
来 的 章节 中 ， 我 们 将 讨论 如 何 通 过 巧妙 的 数据 处 理 改 进 空间 复杂 度 。 

















2.5 人 小结 


算法 不 同 ， 所 需 的 计算 时 间 与 计算 机 内 存 也 有 所 不 同 。 借 由 时 间 复 杂 度 
与 空间 复杂 度 分 析 ， 可 以 对 算法 性 能 进行 评估 。 我 们 通过 计算 精确 的 
T) 函数 〈《 即 算法 执行 的 运算 次 数 ) 来 求解 时 间 复 杂 度 。 


这 一 草 还 讨论 了 如 何 通 过 大 O 符号 (O) 来 表示 时 间 复 杂 度 ， 本 书 将 
使 用 这 个 符 成 对 算法 进行 向 单 的 时 间 复 杂 度 分 析 。 很 多 情况 下 ， 在 推 
断 算 法 的 大 O 复杂 度 时 无 须 计 算 TUOD)。 下 一 草 将 介绍 复杂 度 计算 的 简 
便 方 法 。 

由 于 执行 指数 算法 的 成 本 会 急剧 增加 ， 在 输入 很 大 时 使 用 指数 算法 并 不 
可 行 。 此 外 ， 我 们 还 讨论 了 以 下 问题 。 

D 对 于 不 同 的 算法 ， 执 行 算法 所 需 的 运算 是个 存在 显 堵 差异 ? 

D 将 输入 规模 乘 以 菏 个 前 数 ， 算 法 的 运行 时 间 会 发 生 哪 些 变 化 ? 

D 当 输入 规模 增长 时 ， 算 法 的 运算 次 数 是 人 否 会 随 之 增加 ? 








口 给 定 输入 规模 上 时， 如 果 算 法 的 运行 速度 过 慢 ， 那 么 优化 算法 或 使 用 
超级 计算 机 是 否 有 用 ? 

下 一 章 将 重点 探讨 算法 设计 背后 的 策略 与 时 间 复 杂 度 之 间 的 关系 。 

o 《计算机 程序 设计 艺术 ( 卷 1)》2， 高 德 纳 著 


口 视频 “Pvs.NPandthe Computational Complexity Zoo ， 上 传 者 hackerdashery 
口 视频 “What Is Big O? (Comparing Algorithms)”, E1 Undefined Behavior 


Q) 该 书 第 3 版 已 由 人 民 邮 电 出 版 社 出 版 ， 详 见 http:/www.ituring.com.cn/book/993, 


找到 一 种 好 的 走 法 后 ， 设 法 寻找 更 好 的 走 法 。 
一 一 伊 曼 纽 尔 . 拉 斯 克 


历史 会 铭记 那些 运用 合理 谋略 取得 伟大 成 就 的 将 军 ， 运 筹 帷 悍 是 顺利 解 
类 问题 的 先决 条 件 。 这 一 革 将 讨论 算法 设计 中 使 用 的 主要 策略 ， 包 括 : 


d 通过 达 代 处 理 重 复 性 任务 
条 利用 递归 优雅 地 进行 进 代 
b 为 证 省 时 间 ， 在 资源 允许 时 通过 蛮 力 法 求解 问题 
A 测试 不 可 行 的 选择 并 回 淹 
I 采用 启发 法 合理 地 缩短 求解 时 间 
汪 采用 分 治 法 求解 妈 难 的 问题 
S 动态 地 识别 重复 问题 以 免 重复 浪费 资源 
对 问题 定 丙 以 缩小 求解 范围 


这 一 章 将 涉及 大 量 数学 工具 ， 但 无 须 担 心 ， 我 们 将 从 简单 的 问题 入 手 ， 
逐步 介绍 各 种 方法 ， 探 讨 如 何 构建 更 好 的 解 。 读 者 很 快 就 能 为 计算 问题 
找到 合理 且 富 有 说 服 力 的 解 。 


3.1 Gr 


达 代 策略 利用 循环 〈 如 for 和 while) 来 重复 一 个 过 程 ， 直 至 满足 茶 个 
条 件 。 循 环 中 的 每 一 步 都 称 为 欠 代 。 友 代 非 向 适合 在 输入 中 和 运行， 并 在 
每 个 部 分 应 用 相同 的 操作 。 举 例如 下 。 

O 伊 曼 纽 尔 ' 拉 斯 克 (1868 一 1941) ， 德 国 国际 象棋 大 师 ，26 岁 时 成 为 国际 象棋 史上 
第 二 位 世界 冠军 。 拉 斯 克也 是 一 位 数学 家 ， 曾 师 从 于 数学 大 师 希 尔 伯 特 ， 并 以 对 
交换 代数 的 贡献 而 闻名 于 世 。 虽 然 身 为 国际 象棋 大 师 ， 但 拉 斯 克 对 围棋 十 分 推崇 ， 
称赞 围棋 是 “天 外 文明 ”。 一 一 译 者 注 

















鱼 类 团聚 CQ 分 别 给 出 感 水 鱼 和 淡水 鱼 的 列表 ， 两 个 列表 中 
的 鱼 名 均 按 字 母 顺 序 排列 。 如 何 创 建 一 个 包含 所 有 鱼 类 的 列表 
( 鱼 名 按 字 母 顺序 排列 ) ? 


如 下 所 示 ， 我 们 途 代 地 比较 两 个 列表 中 的 顶部 元 素 。 





四 Së SS SS SS S Sp 时 


ef 
ke 








3-1 将 两 个 排 


E 


列表 合并 到 第 3 个 排序 列表 中 
可 以 通过 一 个 while 循环 实现 上 述 过 程 。 


function merge(sea, fresh) 
result e List.new 


while not (sea.empty and fresh.empty) 
if sea.top_item > fresh.top_item 
fish e sea.remove_top_item 
else 
fish e fresh.remove_top_item 
result.append(fish) 


return result 


程序 将 循环 遍历 输入 中 的 所 有 鱼 名 , 对 每 个 名 称 执行 固定 数量 的 操作 。™ 
因此 ，merge 算法 的 时 间 复 杂 度 为 O(n)。 





O 输入 规模 是 合并 后 两 个 输入 列表 中 的 元 素数 量 。while 循环 对 每 个 元 素 执 行 3 次 操 
作 ， 因 此 T(n)= 3n。 


31 A | 35 


RR 


第 2 章 讨 论 了 selection sort är Hi GC rd bt, Oh DIE, 
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集 是 由 5 的 全 部 子 集 构成 的 集合 。” 


香味 的 秘密 鲁 ”香水 提炼 自 各 种 花香 。 给 定 花 的 集合 已， 如何 
列 出 所 有 可 以 制造 的 香水 ? 


任何 香水 都 由 玫 的 一 个 子 集 制 成 ， 因 此 到 的 需 集 包括 所 有 可 能 的 香水 ， 
可 以 通过 返 代 法 进行 计算 。 如 采 役 有 化 ， 那 么 只 可 能 制造 一 种 香水 ， 即 
无 味 的 香水 。 每 增加 一 种 伦 ， 我 们 复制 已 有 的 香水 ， 并 将 新 的 伦 加 入 到 
复制 后 的 香水 中 。 通 过 图 3-2 不 难 理解 这 个 过 程 。 
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采用 循环 不 难 拉 述 上 述 过 程 : 外 层 循 环 负责 跟踪 下 一 种 需要 考虑 的 花 ， 
而 内 层 循 环 负 责 复制 香水 ， 并 将 当前 的 花 加 入 到 复制 后 的 香水 中 。 


function power_set(flowers) 
fragrances ¢ Set, new 
fragrances.add(Set.new) 
for each flower in flowers 
new_fragrances < copy(fragrances) 
for each fragrance in new_fragrances 
fragrance.add(flower) 
fragrances ¢ fragrances + new_fragrances 
return fragrances 





































































































O 有 关 集 合 的 详细 解释 请 参见 附录 。 
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每 增加 一 种 花 ，fragrances 的 数量 将 增加 一 倍 ， 说 明 power zer 算法 
呈 指 数 增长 (2”= 2x2 )。 如 果 输 入 规模 每 增加 一 项 都 会 导致 算法 的 
运算 次 数 倍 增 ， 表 示 该 算法 具有 指数 时 间 ， 其 时 间 复 杂 度 为 O. 
构建 究 集 相当 于 构建 真 值 表 (相关 讨论 请 参见 1.2 市 )。 如 果 将 每 种 花 映 
射 到 一 个 布尔 变量 ， 那 么 任何 香水 都 可 以 表示 为 这 些 变量 的 True/False 
值 。 在 这 些 变量 构成 的 真 值 表 中 ， 每 行 代表 一 种 可 能 的 香水 配方 。 











3.2 GI" 


递归 表示 函数 在 定义 中 调用 自身 。 因 此 ， 我 们 上 自然 会 想到 利用 递归 算法 
来 求解 那些 涉及 自身 定义 的 问题 。 以 闭 名 的 斐 波 那 契 数列 为 例 ， 前 两 
个 数 为 1， 之 后 的 每 个 数 均 为 前 两 个 数 之 和 : 1、1、2、3、5、8、13、 
21…… 汪 那么 ， 如 何 编写 一 个 返回 第 于 个 斐 波 那 契 数 的 函数 呢 ? 


function fib(n) 


if ne? 
return 1 
return fib(n - 1) + fib(n - 2) 


图 3-3 ”递归 地 计算 第 6 ERIR 


对 于 涉及 目 且 定义 的 问题 ， 可 以 芳 虑 使 用 递归 。 例 如 ， 判 断 一 个 单词 是 否 
属于 回 文 ”“， 即 检查 单词 被 反 转 后 是 否 保持 不 变 。 此 外 ， 如 果 一 个 单词 的 首 


O 如 果 考 虑 第 0 项 ， 则 斐 波 那 契 数列 为 0、1、1、2、3、5、8、13、21…… 换 言 之 ， 
斐 波 那 契 数列 的 前 两 个 数 要 么 为 1 和 1， 要 么 为 0 和 1， 取 决 于 所 选 的 起 始 项 是 第 
1 项 还 是 第 0 项 。 一 一 译 者 注 

© 回 文 单词 正 读 或 反 读 均 相 同 ， 如 Ada ( 埃 达 ) 与 racecar (赛车 )。 





尾 字符 相同 ， 且 首尾 字符 之 间 的 子 单 词 属于 回 文 ， 则 该 单词 同样 属于 回 文 。 


function palindrome (word) 
if word. length s 1 
return True 
if word. first char z word. last char 
return False 
w € word.remove_first_and_last_chars 
return palindrome (w) 


palindrome('racecar') 


palindrome('aceca') 


palindrome('cec') 





3-4 ”递归 地 检查 racecar 是 否 属于 回 文 
在 递归 算法 中 ， 当 输入 减 小 到 无 法 再 小 时 则 达到 基线 条 件 。Fib 算法 的 
基线 条件 为 数字 1 和 2， 而 palindrome 算法 的 基线 条 件 为 包含 一 个 或 
零 个 字符 的 单词 。 





EE AR 


与 迭代 算法 相 比 ， 递 归 算 法 通 稍 更 向 得。 观察 以 下 递归 算法 ， 并 与 前 一 
广 示 使 用 递归 的 power_set 算法 进行 比较 。 


function recursive_power_set(items) 
ps < copy(items) 
for each e in items 
ps e ps.remove(e) 
ps é ps + recursive_power_set(ps) 
ps e ps.add(e) 
return ps 


然而 ， 售 单 并 非 没有 代价 。 递 归 算 法 在 执行 时 会 大 量 调 用 上 自 壬 ， 从 而 引 
入 计算 开销 。 计 算 机 必须 跟踪 未 完成 的 递归 调用 及 其 部 分 计算 ， 内 存 消 
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耗 将 因此 而 增加 。 此 外 ， 从 当前 递归 调用 切换 到 下 一 个 递归 调用 并 返回 
也 需要 额外 的 CPU 周期 。 


我 们 可 以 通过 递归 树 直 观 地 理解 这 个 次 在 问题 。 递 归 树 是 一 种 示意 图 ， 
Ce 图 3-3 是 计 
斐 波 那 契 数 计算 的 递归 树 ， 图 3-4 是 检 查 回 文 单词 的 递归 树 。 


如 采 必 须 最 大 限度 提高 性 能 ， 可 以 采用 纯粹 的 迭代 形式 重 写 递 归 算 法 以 
避免 引入 开销 ， 这 总 是 可 以 实现 鸭 。 不 过 我 们 需要 做 出 权衡 : TTC 
的 速度 通常 更 快 ， 但 更 为 复杂 且 更 难 理 解 。 


3.3 SI 


蛮 力 策略 对 问题 所 有 可 能 的 候选 解 进行 检验 ， 也 称 为 穷 举 搜 索 。 这 和 十 一 
种 朴素 且 芝 无 技 马 可 言 的 策略 : 即便 存在 数 十 亿 个 候选 解 ， 蛮 力 法 也 完 
全 依靠 计算 机 的 力量 来 逐一 检验 每 个 解 。 
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图 3-5” 蛮 力 策略 的 简单 解释 ( 取 自 http:/geek-and-poke.com/) 
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接 下 来 ， 我们 讨论 如 何 利 用 蛮 力 法 求解 以 下 问题 。 


最 佳 交 易 国 ”我 们 了 解 一 段 时 间 内 的 每 日 金价 ， 并 而 望 从 中 找 
出 两 个 交易 日 ， 如 果 在 此 期 间 买 入 然后 卖 出 黄金 ， 就 能 实现 利 
润 最 大 化 。 


最 低 价 洋 入 、 最 高 价 买 出 并 非 总 古 可 行 : 取 低 价 可 能 出 现在 最 高 价 之 
后 ， 我 们 无 法 预知 。 塞 力 法 通过 评估 所 有 可 能 的 交易 日 组 合 进行 求解 : 
歼 取 每 个 交易 日 组 合 的 利润 ， 并 与 目前 找到 的 最 佳 交 易 进 行 比较 。 不 难 
看 出 ， 交 易 日 组 合 的 数量 将 随时 间 间 隔 的 增加 呈 二 次 增长 。” 无 须 编写 
代码 ， 我 们 已 可 确定 蛮 力 算法 的 时 间 复 杂 度 必然 为 O(n )。 


未 些 策 略 具有 更 好 的 时 间 复 杂 度 ， 稍 后 将 讨论 利用 这 些 沫 略 求解 最 佳 交 
易 问 题 。 但 蛮 力 法 有 时 的 确 能 提供 最 好 的 时 间 复 杂 度 ， 举 例如 下 。 


背包 问题 体 你 将 准备 销售 的 物品 放 进 背包 。 但 背包 的 承重 
有 限 ， 无 法 携带 所 有 物品 ， 因 此 必须 对 装 入 背包 的 物品 做 出 选 
择 。 给 定 每 件 物 品 的 重量 和 销售 价值 ， 那 么 携带 哪些 物品 才能 
获得 最 大 利润 ? 


物品 的 震 集 2 包括 所 有 可 能 的 物品 选择 ， 蛮 力 法 将 对 所 有 物品 选择 进行 
人 检验。 我们 已 经 了 解 计算 震 集 的 方法 ， 因 此 利用 蛮 力 算法 求解 背包 问题 
并 非 难事 。 


function knapsack(items, max_weight) 
best_value < 0 
for each candidate in power_set(items ) 
if total_weight(candidate) e max_weight 
if sales_value(candidate) > best_value 

best_value ¢ sales_value(candidate) 
best_candidate e candidate 

return best_candidate 


n 件 物品 共有 2" 种 物品 选择 。 我 们 检查 每 种 物品 选择 的 总 重 是 奋 不 超 过 
育 包 容量 ， 以 及 它 的 销售 价值 是 否 高 于 目前 找到 的 最 高 价值 。 由 于 对 每 
种 物品 选择 都 要 进行 固定 数量 的 操作 ， 算 法 的 时 间 复 杂 度 为 0(2”)。 











O 根据 1.3 布 的 讨论 可 知 ， 如 果 时 间 间 隔 为 nx， 则 交易 日 组 合 的 数量 为 wz + 1)/2。 
D 有 关 适 集 的 解释 请 参见 附录 。 
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然而 ， 检 查 所 有 物品 选择 并 非 必须 。 因 为 许多 选择 会 使 背包 处 于 半空 状 
态 ， 意 味 着 存在 更 好 的 方法 。” 接 下 来 ， 我 们 将 讨论 有 助 于 优化 搜索 的 
菏 略 ， 以 便 在 求解 过 程 中 尽 可 能 丢弃 无 用 的 候选 解 。 


3.4 EIA 





Sek Dk en 己方 棋子 可 以 在 一 个 8&x 8 的 棋盘 上 移动 以 攻击 
对 方 棋子 。 后 十 实力 最 强 的 棋子 ， 它 能 吃 掉 处 于 同一 行 、 同 一 列 或 同一 
和 斜 线 的 对 方 棋子 。 我 们 以 一 个 闭 名 的 国际 象棋 同 题 为 背景 讨论 回 济 法 。 


八 皇 后 问题 攻 ”在 棋盘 上 放置 8 个 后 ， 如 何 才 能 使 它们 无 法 相 

互 攻 击 ? 
请 读者 尝试 手动 求解 ,但 会 发 现 这 并 非 易 事 。” 图 3-6 显示 了 其 中 一 种 可 
以 使 所 有 后 和 平 共处 的 摆 放 方法 。 
























































图 3-6 ”最 左 侧 的 后 会 攻击 其 他 后 ， 将 其 上 移 一 格 ， 所 有 后 就 无 法 相互 攻击 


O 背包 问题 属于 2.3 节 讨 论 的 NP 完全 问题 。 无 论 采 用 哪 种 策略 ， 仅 有 指数 算法 可 以 
解决 这 个 问题 。 
@) Code Energy 提供 了 在 线 解答 八 皇后 问题 的 平台 : https://code.energy/8-queens-problem/。 
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1.3 方 曾经 讨论 过 ，8 个 后 在 棋盘 上 的 摆 放 方法 超过 40 亿 种 ， 因 此 试图 
利用 弯 力 法 检验 所 有 摆 放 方法 显然 不 可 行 。 想 象 一 下 ， 如 东 前 两 个 后 被 
置 于 能 相互 吃 掉 对 方 的 位 置 ， 那 么 接 下 来 的 后 无 论 放 在 何 处 都 无 法 使 问 
题 有 解 。 然 而 ， 蛮 力 法 将 时 间 痕 费 在 检验 这 些 没有 意义 的 摆 放 方法 上 。 


因此 ， 仅 搜索 可 行 的 位 置 会 更 有 效率 。 第 一 个 后 可 以 放 在 任何 位 置 ， 即 
将 放置 的 后 受 限 于 已 经 放置 的 后 ， 即 不 能 将 一 个 后 放 在 另 一 个 后 的 攻击 
范围 之 内 。 遵 循 这 条 原则 ， 也 可 能 在 完成 所 有 gong "er, A 
上 就 已 没有 可 行 的 位 置 ( 见 图 3-7). 
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图 3-7 所 示 的 情况 意味 着 最 后 一 个 后 放 错 了 位 置 ， 因 此 我 们 进行 回溯: 
回 深 到 前 一 个 位 置 ， 然 后 继续 搜索 。 这 就 古 回 浏 策 略 的 本 质 所 在 : 始终 
保持 所 有 的 后 处 于 不 会 相互 攻击 的 位 置 ， 一 旦 陷入 困境 ， 回 深 到 最 后 一 
个 后 的 位 置 并 重新 选择 。 可 以 通过 递归 人 简化 上 述 流 程 。 


function queens (board) 

if board.has_8_queens 
return board 

for each position in board.unattacked_positions 
board.place_queen (position) 
solution e queens (board) 
if solution 

return solution 

board.remove_queen(position) 

return False 


历 下 一 个 后 的 所 有 可 行 位 置 。 程 序 


完成 一 个 后 的 摆 放 后 ， 程 序 将 循环 过 
利用 递归 算法 检验 将 一 个 后 放 在 每 个 


题 有 解 ， 过 程 


可 


行 位 置 上 能 人 否 使 | 


可 
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到 3-8 八 呈 后 问题 中 的 回潮 
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如 琳 解 是 一 系列 选择 ， 且 后 续 选 择 受 限 于 已 做 出 的 选择 ， 则 回溯 法 是 求 
解 问 题 的 最 有 效 方法 。 这 种 策略 有 助 于 尽早 确定 那些 无 法 使 问题 有 解 的 
选择 ， 从 而 在 最 短 时 间 内 退回 到 上 一 步 并 答 试 其 他 选择 。 痕 言 道 ， 早 失 
败 ， 常 失败 。 











3.5 局 发 法 


标准 的 国际 象棋 包括 32 枚 棋子 ， 它 们 分 为 6 种 类 型 ， 可 以 在 64 个 方 格 
中 移动 。 在 走 完 前 4 步 后 ， 就 已 出 现 2880 亿 种 可 能 的 位 置 。 世 界 上 最 
强 鸭 棋 手 也 无 法 找到 最 合适 的 走 法 ， 但 他 们 会 依靠 直 先 找 出 一 种 足够 好 
的 走 法 。 同 样 的 思路 也 适用 于 算法 。 启 发 式 方法 (或 简称 启发 法 ) 古 一 
种 不 保证 能 得 到 节 佳 解 或 最 优 解 的 方法 。 当 弯 力 法 或 回调 法 这 样 的 方法 
过 慢 时 ， 改 用 局 发 法 可 能 会 有 所 帮助 。 在 许多 有 趣 的 局 发 法 中 ， 我 们 将 
重点 讨论 最 简单 的 非 回 淹 。 


3.5.1 ”贪心 法 


贪心 法 是 求解 问题 时 一 种 极为 第 用 的 启发 法 ， 这 种 策略 永远 不 会 回 退 到 
之 前 的 选择 。 与 回调 法 相反 ， 贪 心 法 答 试 在 每 一 步 都 做 出 最 佳 选择 ， 且 
它 具 有 无 后 效 性 。 我 们 将 3.3 元 全 讨论 的 育 包 问题 稍 加 改动 ， 然 后 利用 
贪心 法 求解 。 


有 那 恶 背包 问题 避 ”一 名 贪心 的 窃贼 间 入 你 家 窃取 准备 销售 的 物 
品 ， 他 决定 将 偷 来 的 东西 装 入 背包 。 那 么 他 会 偷 哪些 东西 ? 记 
住 ， 窍 贼 在 你 家 停留 的 时 间 越 短 ， 被 抓 住 的 可 能 性 就 越 小 。 


从 本 质 上 说 ， 上 述 问 题 的 最 优 解 应 该 与 背包 问题 完全 相同 。 但 窃贼 来 不 
及 计算 所 有 物品 组 合 ， 也 设 有 时 间 不 断 回 斋 并 拿 出 已 经 装 入 背包 的 物 
品 。 贪 心 的 穹 贼 会 不 断 将 最 值钱 的 物品 半 入 背包 ， 直 到 无 法 装 下 更 多 东 
西 为 止 。 

function greedy_knapsack(items, max_weight) 


Dag weight < 0 
bag_items e List.new 
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for each item in sort_by_value(items) 
if max_weight > bag_weight + item.weight 
Dag weight < bag_weight + item.weight 
bag_items.append(item) 
return bag_items 


我 们 并 未 考虑 基 种 选择 如 何 对 之 后 的 选择 产生 影响 。 与 蛮 力 法 相 比 ， 贪 心 
法 能 更 快 地 找到 一 种 物品 选择 ， 但 并 不 保证 会 找到 组 合 价值 最 高 的 选择 。 
在 计算 思维 中 ,“ 贪 畦 ” 并 非 罪 恶 的 代名词 。 即 便 是 诚实 的 商人 ， 也 可 
能 希望 利用 贪心 法 解决 与 打包 或 旅行 有 关 的 问题 。 
旅行 推销 员 ( 续 ) 例 ”推销 员 必 须 到 访 n 座 给 定 的 城市 ， 并 在 旅 
程 结束 时 回 到 出 发 地 。 哪 种 旅行 计划 能 使 旅行 的 总 距离 最 短 ? 
正如 1.3 节 讨 论 的 那样 ， 即 便 只 有 少量 城市 ， 需 要 考虑 的 城市 排列 也 会 
达到 相当 惊人 的 数量 。 为 涉及 几 千 座 城 市 的 旅行 推销 员 问 题 寻求 最 优 解 
耗费 极其 昂贵 ,或 根本 无 法 实现 。” 但 我 们 仍然 需要 找到 一 条 路 线 ， 一 
种 简单 的 贪心 算法 如 下 所 示 。 
(1) 到 访 最 近 一 座 未 曾 到 访 过 的 城市 。 
(2) 重复 上 述 步骤 ， 直 至 到 访 所 有 城市 。 
读者 能 否 找到 比 贪心 法 更 好 的 局 发 法 呢 ? 这 是 计算 机 科学 家 一 直 致 力 于 
研究 的 一 个 问题 。 


动态 规划 算法 . 


在 eBay 上 推销 


国 (20) 





图 3-9 “旅行 推销 员 问 题 





O 旅行 推销 员 问 题 属于 2.3 市 讨论 的 NP 完全 问题 ,无 法 找到 比 指数 算法 更 好 的 最 优 解 。 
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3.5.2 ”利用 贪心 法 求解 电网 问题 


求解 问题 时 ， 需 要 在 局 发 式 算 法 与 经 典 算 法 之 间 做 出 权衡 。 例 如 ， 愿 意 提 
受 何 种 程度 的 背包 最 大 利润 或 旅行 最 佳 路 线 ? 应 根据 具体 情况 进行 选择 。 


然而 ， 即 便 在 绝对 需要 最 优 解 的 情况 下 ， 也 不 要 将 启发 法 束 之 高 效 。 茶 
些 情况 下 ， 利 用 局 发 法 同样 可 能 获得 最 优 解 。 例 如 ， 我 们 可 以 编写 一 种 
信心 算法 ， 系 统 地 找 出 与 亦 力 法 相同 的 解 。 举 例如 下 。 


电网 连接 儿 ”偏远 地 区 的 定居 点 没有 电力 供应 ， 但 其 中 一 个 定 
居 点 正在 建设 一 座 发 电厂 。 电 力 经 由 输电 线 从 一 个 定居 点 输送 
到 其 他 与 之 相连 的 定居 上 点， 那么 如 何 使 用 最 短 的 输电 线 将 所 有 
定居 点 连 入 电网 ? 


这 个 问题 并 不 复杂 ， 思 路 如 下 。 


(1) 从 疯 未 连 入 电网 的 定居 点 中 ， 选 择 与 已 有 电力 供应 的 定居 扩 距 离 最 
近 的 那个 定 大 点 ， 并 将 二 者 连接 起 来 。 
(2) 重复 上 述 步 台 ， 直 至 将 所 有 定居 点 连 入 电网 。 


在 每 一 步 中 ， 我 们 选择 当前 看 来 最 好 的 一 对 定 后 点 进行 连接 。 即 便 不 竹 
虑 某 种 选择 如 何 影 啊 之 后 的 选择 ， 将 最 近 一 个 没有 电力 供应 的 定居 扩 连 
入 电网 也 始终 是 正确 选择 。 季 运 的 是 ， 这 个 问题 的 结构 非常 适合 通过 仙 
心算 法 进行 求解 。 下 一 万 将 讨论 如 何 对 问题 分 而 治之 ， 这 也 是 那些 秒 名 
将 领 采 用 的 宋 略 。 
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图 3-10 ”利用 贪心 法 求解 电网 问题 
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3.6 Mimì 


分 割 成 块 的 敌人 便于 各 个 击破 。 凯 撒 与 拿破仑 之 所 以 能 统治 欧 训 ， 征 因 
为 他 们 对 敌人 采取 分 而 治之 的 策略 。 相 同 的 策略 也 可 以 用 于 求解 问题 ， 
尤其 是 那些 具有 最 优 子 结构 的 问题 : 将 这 些 问 题 分 解 为 丰 干 相似 但 更 小 
的 子 问 题 ， 反 复 进 行 分 解 操 作 ， 直 至 子 问题 变 得 匈 于 求解 ， 将 各 个 子 问 
题 的 解 合并 在 一 起 ， 即 可 得 到 原 问题 的 解 。 


3.6.1 利用 分 治 法 求解 排序 问题 


如 有 需要 对 一 个 大 列表 排序 ， 可 以 将 其 一 分 为 二 ， 得 到 两 个 待 排序 的 
子 问题 。 利 用 merge 算法 将 两 个 子 问 题 的 解 ( 即 经 过 排序 的 两 个 子 列 
K) 合 二 为 一 ， 就 能 实现 对 整个 列表 的 排序 。 那 么 如 何 对 两 个 子 问题 排 
序 呢 ? 将 二 者 分 解 为 子 子 问 题 ， 然 后 进行 排序 与 合并 。 新 的 子 子 问题 仍 
然 可 以 继续 分 解 、 排 序 与 合并 。 分 解 操 作 一 直 进 行 下 去 ， 直 至 达到 基线 
条 件 ， 即 仅 包含 一 个 元 北 的 列表 ， 而 它 已 经 是 排 好 序 的 。 
function merge_sort(list) 
if list. length = 1 
return list 
left & list.first half 
right < list.last_half 
return merge(merge_sort(left), 
merge_sort(right)) 
这 种 优雅 的 递归 算法 称 为 归并 排序 。 对 于 3.2 HEE AZA, 
可 以 通过 图 3-11 所 示 的 递归 树 观察 merge_sort 函数 调用 上 自身 的 次 数 。 


O 本章 讨 论 的 第 一 个 算法 ( 详 见 3.1 节 )。 
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split step 1 





27 
split step 2 


split step 3 


split step 4 


图 3-11 归并 排序 算法 执行 示例 ， 和 矩形 表示 单独 的 merge_sort 调用 ， 上 半 部 
分 为 输入 ， 下 半 部 分 为 输出 


那么 ， 如 何 找 出 归并 排序 算法 的 时 间 复 杂 度 呢 ? 为 此 ， 我 们 首先 计算 各 
个 独立 分 解 步骤 产生 的 操作 次 数 ， 然 后 计算 分 解 步骤 的 总 数 。 


计算 操作 次 数 ” 假 设 大 列表 的 规模 为 n，merge_sort 函数 在 调用 时 将 
执行 以 下 操作 。 


D 将 列表 一 分 为 二 : 该 操作 与 列表 规模 无 关 ， 其 时 间 复 杂 度 为 O(1)。 
O merge 算法 : 根据 3.1 证 的 讨论 可 知 ， 其 时 间 复 厅 度 为 O(n)。 
O 两 次 不 计算 在 内 的 merge_sort 递归 调用 。” 


由 于 保留 最 强 的 项 且 弟 归 调 用 不 计算 在 内 ， 函 数 的 时 间 复 杂 度 为 O(n)。 
接 下 来 ， 我 们 计算 各 个 分 解 步 又 的 时 间 复 杂 度 。 


D 分 解 步骤 1 对 包含 nn 个 元 素 的 列表 调用 merge_sort 国 数 。 这 一 步 
的 时 间 复 杂 度 为 O(n)。 

D 分 解 步骤 2 对 包含 w2 个 元 素 的 列表 调用 merge_sort 国 数 ， 共 计 
两 次 。 这 一 步 的 时 间 复 杂 度 为 2 x O(n/2) On). 





O 递归 调用 执行 的 操作 计 入 下 一 个 分 解 步骤 。 
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D 38283 对 包含 w4 个 元 素 的 列表 调用 merge_sort 函数 ， 共 计 
4 次 。 这 一 步 的 时 间 复 杂 度 为 4x O(n/4) = O(n)。 

D 分 解 步骤 X 对 包含 n/2 个 元 素 的 列表 调用 merge_sort 函数 ， 共 计 
2 次 。 这 一 步 的 时 间 复 杂 度 为 2 x O(n/2)= O(n)。 


由 于 各 个 分 解 步 又 的 时 间 复 杂 度 均 为 O(n)， 归 并 排序 算法 的 时 间 复 厅 
度 为 xx O(n)， 其 中 x 为 执行 全 部 操作 所 需 的 分 解 步骤 次 数 。™ 


计算 分 解 步骤 如 何 求解 xz 呢 ? 我 们 知道 ， 递 归 畏 数 在 达到 基线 条 件 
( 仅 包 含 一 个 元 素 的 列表 ) 时 将 停止 调用 自身 。 且 根据 之 前 的 讨论 可 知 ， 
分 解 步骤 x 适用 于 处 理 包含 w2 个 元 素 的 列表 。 因 此 : 


erla? =n A x=log,n 
An ZA AE AT A K RI SEET x= log n KÆ 2 = 天 的 另 一 种 形 
式 一 一 程序 员 偏 好 使 用 对 数 增长 。 观 察 表 3-1 可 以 看 到 ， 与 待 排 序 的 元 
素 总 数 相 比 ， 所 需 的 分 解 步骤 次 数 呈 现 缓慢 增长 的 趋势 。” 


表 3-1 不 同和 输入 规模 所 需 的 分 解 步骤 次 数 


输入 规模 (n) log2n 所 需 的 分 解 步骤 
10 EE 4 
100 6.64 7 
1024 10.00 10 
1 000 000 19.93 20 
1 000 000 000 29.89 30 


因此 ， 归 并 排序 算法 的 时 间 复 杂 度 为 oe, nx O(n) Om log n), Zi 
择 排序 算法 的 时 间 复 杂 度 O0)， 这 是 一 个 巨大 的 改进 。 读 者 是 否 还 记 
得 线性 对 数 算 法 与 二 次 算法 之 间 的 性 能 差异 〈 图 2-4) ? 观察 表 3-2 可 
以 看 到 ， 即 便 运行 Om 算法 的 计算 机 速度 更 快 ， 它 最 终 也 会 比 运行 
OU log n) 算法 的 计算 机 慢 得 多 。 
O 由 于 x 并 非常 量 ,不 能 省 略 。 如 果 列 表 规模 n 增长 为 原来 的 两 倍 , 则 需要 再 分 解 一 次 ，; 
如 果 n 增长 为 原来 的 4 倍 ， 则 需要 再 分 解 两 次 。 


D 对 于 任何 逐步 减少 输入 并 在 每 一 步 中 除 以 一 个 常数 因子 的 过 程 ， 都 需要 对 数 个 步 
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表 3-2 当 输 入 较 大 时 ， 即 便 运 行 O(n ) 算法 的 计算 机 比 运行 O(n log n) 算法 的 
计算 机 快 1000 倍 ， 前 者 的 速度 最 终 也 不 及 后 者 














输入 规模 二 次 算法 线性 对 数 算 法 

196 (全 球 国家 数 ) 38 上 毫秒 2 Ek 

4.4 万 (全 球 机 场 数 ) 32 分 钟 12 分 钟 

17.1 万 (英语 单词 数 ) 8 小 时 51 分 钟 

100 万 (夏威夷 州 居 民 数 ) E 6 小 时 
1900 万 (佛罗里达 州 居民 数 ) 11 年 6 天 
1.3 亿 (迄今 为 止 出 版 的 图 书 数 ) 500 年 41 天 
47 亿 (因特网 的 网 页 数 ) 70 万 年 5 年 








请 读者 分 别 编写 线性 对 数 排序 算法 与 二 次 排序 算法 ， 并 比较 二 者 在 排序 
不 同 规模 的 随机 列表 时 性 能 有 何不 同 。 当 输入 较 大 时 ， 时 间 复 杂 度 的 改 
进 往往 至 关 重 要 。 接 下 来 ， 我 们 采用 分 治 法 求解 之 前 通过 蛮 力 法 解决 的 
问题 。 








3.6.2 ”利用 分 治 法 求解 最 佳 交易 问题 


对 于 3.3 区 国 讨 论 的 最 佳 交 易 问 题 ， 分 治 法 较 之 简单 的 蛮 力 法 更 胜 一 筹 。 
将 价格 历史 一 分 为 二 可 以 得 到 两 个 子 问 题 ， 分 别 找 出 前 半 段 时 间 与 后 半 
段 时 间 的 最 佳 交 易 。 整 个 时 段 内 的 最 佳 交 易 属 于 以 下 某 种 情况 。 


(1) 在 前 半 上 段 时 间 买 入 与 卖 出 的 最 佳 交 易 。 
(2) 在 后 半 上 段 时 间 买 入 与 卖 出 的 最 佳 交 易 。 
(3) 在 前 半 段 时 间 关 入 、 后 半 段 时 间 卖 出 的 最 佳 交 易 。 


前 两 种 情况 是 两 个 子 问题 的 解 ， 第 3 种 情况 也 不 难 求解 : 在 前 半 段 时 间 
出 现 最 低 价 时 买 入， 并 在 后 半 段 时 间 出 现 最 高 价 时 卖 出 。 如 朱 间 隔 仅 为 
一 天 ， 则 唯一 可 能 存在 的 交易 是 在 同一 天 飞人 并 卖 出 ， 因 此 收益 为 零 。 


function trade(prices) 
if prices.length = 1 
return 0 
former < prices.first_half 
latter < prices.last_half 
case3 < max(latter) - min(former) 
return max(trade(former), trade(latter), case3) 
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图 3-12 trade AEAT PERRE mA MAA trade 调用 


调用 trade 国 数 将 执行 简单 的 比较 与 分 解 操 作 ， 并 查找 前 半 段 时 间 与 后 
半 段 时 间 的 最 大 值 与 最 小 值 。 为 找 出 n 个 元 素 中 的 最 大 值 或 最 小 值 ， 需 
要 检查 每 一 个 元 素 ， 因 此 一 个 独立 trade 调用 的 时 间 复 杂 度 为 ON). 


观察 trade 算法 的 递归 树 (图 3-12) 可 以 看 到 ， 它 与 归并 排序 算法 的 
递归 树 (图 3-11) 非常 类 似 。trade 算法 同样 需要 log, n 个 分 解 步 又 ， 
且 每 个 分 解 步 又 的 时 间 复 杂 度 为 O(n)， 由 此 得 到 trade 算法 的 时 间 复 
杂 度 为 O(n log 门 。 与 之 前 讨论 的 蛮 力 法 〈 时 间 复 杂 度 为 O(n)) 相 比 ， 
这 征 一 个 巨大 的 改进 。 


3.6.3 利用 分 治 法 求解 背包 问题 

3.3 节 则 讨论 的 背包 问题 同样 可 以 采用 分 治 法 求解 。 请 记 住 ， 共 有 件 
物品 可 供 选择 。 每 件 物品 具备 以 下 属性 : 

wi 是 第 i 件 物品 的 重量 

o “是 第 ; 件 物品 的 价值 

索引 i 可 以 是 1 与 4 之 间 的 任何 数字 。 假 设 背包 容量 为 c， 则 从 nn 件 物 


号 中 选择 后 歼 得 的 最 大 利润 为 K(n, c)。 如 末 新 增 一 件 物品 i= n+ 1， 它 
可 能 会 (也 可 能 不 会 ) 提高 闹 在 的 最 大 利润 ， 后 者 包括 以 下 两 种 情况 。 
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(1) Kin, ci: 未 选择 新 增 的 物品 。 

(2) Kin, c- wn) + vaa: 选择 新 增 的 物品 。 

第 1 种 情况 不 考虑 新 增 的 物品 。 第 2 种 情况 将 新 增 的 物品 包括 在 内 ， 并 
从 原来 的 物品 中 进行 选择 ， 以 确保 有 足够 的 空间 容纳 它 。 换 言 之 ， 我 们 
可 以 将 n 件 物品 的 解 定义 为 n -1 件 物品 的 最 大 子 解 。 








K(n,c) = max(K(n-1,c),K(n-1,c-w,)+v,) 


现在 应 该 不 难 将 上 述 递 归公 式 转 换 为 递归 算法 。 递 归 地 求解 痛 包 问题 如 
图 3-13 所 示 ， 其 中 多 次 出 现 的 矩形 被 突出 显示 ， 它 们 表示 在 递归 过 程 
中 多 次 进行 计算 的 相同 子 问 题 。 接 下 来 ， 我 们 将 讨论 如 何 通过 避免 重复 
计算 来 提高 性 能 。 


3-13 ”求解 背包 问题 (物品 数量 为 $S， 背 包容 量 为 4) ; 编写 为 5 与 4 的 物品 
重量 为 4， 其 他 物品 的 重量 为 1 


3.7 ”动态 规划 


某 些 情况 下 ， 在 求解 问题 时 会 多 次 进行 相同 的 计算 。” 动态 规划 旨 在 找 
出 重复 的 子 问 题 ， 以 便 对 每 个 子 问 题 只 计算 一 次 。 记 忆 化 是 动态 规划 中 
一 种 常用 的 方法 ， 这 个 术语 的 拼写 和 “记忆 ”非常 类 似 。” 


O 这 类 问题 称 为 具有 重 又 子 问题 。 
D “记忆 化 ”的 英文 是 memoization， 而 “记忆 ”的 英文 是 memorization， 二 者 只 差 一 
"F Ts 译 者 注 
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3.7.1 M00 A e OS 


读者 是 否 还 记得 计算 裴 波 那 契 数 的 算法 ? 观察 图 3-3 所 示 的 递归 树 可 以 
看 到 ，fib 算法 对 fib(3) 进行 了 多 次 计算 。 为 解决 这 个 问题 ， 我 们 可 
以 在 执行 fib 计算 时 将 它们 储存 起 来 ， 仅 为 疝 未 存储 的 计算 生成 fib 
调用 。 这 种 重用 部 分 计算 的 技巧 称 为 记忆 化 ， 它 有 助 于 提高 fib 算法 的 
性 能 。 
Meisi 2 2 21 
function dfib(n) 
if n not in M 
M[n] e dfib(n-1) + dfib(n-2) 
return Min 








fib(6) | 







fib(5) | 





DPI 










DPI EB 
图 3-14 dfib 算法 的 递归 树 ， St rg ër EA DR II 





3.7.2 ”利用 记忆 化 求解 背包 问题 


观察 图 3-13 可 以 看 到 ， 背 包 问 题 的 递归 树 中 显然 存在 多 个 重复 调用 。 
利用 计算 裴 波 那 契 数 时 采用 的 技术 可 以 避免 这 些 重 复 计 算 ， 从 而 减少 计 
算 次 数 。 
动态 规划 可 以 将 速度 极 慢 的 代码 转换 为 速度 适中 的 代码 。 请 仔细 分 析 算 
法 ， 人 确保 不 存在 重复 计算 。 读 者 接 下 来 会 看 到 ， 有 时 候 并 不 容易 发 现 重 
合子 问题 。 
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ez 


图 3-15 ”利用 记忆 化 递归 地 求解 背包 问题 


3.7.3 ”利用 自 底 向 上 法 求解 最 佳 交 易 问 题 


观察 图 3-12 可 以 看 到 ，trade 算法 的 递归 树 不 存在 重复 调用 ， 但 存在 
重复 计算 。 算 法 扫描 输入 以 查找 最 大 值 与 最 小 值 ， 将 输入 一 分 为 二 后 ， 
递归 调用 再 次 扫描 输入 ， 在 前 半 段 时 间 与 后 半 段 时 间 中 查找 最 大 值 与 最 
JME. O 因此， 我 们 需要 一 种 不 同 的 方法 来 避免 这 些 重复 扫描 。 

到 目前 为 止 ， 我 们 均 采 用 自 顶 向 下 法 求解 问题 。 在 这 种 方法 中 ， 输 入 不 
断 减 小 ， 直 至 达到 基线 条 件 。 我 们 也 可 以 采用 自 底 向 上 法 : 首先 计算 基 
线条 件 ， 然 后 不 断 进 行 组 合 ， 直 至 得 到 通 解 。 接 下 来 ， 我 们 利用 这 种 方 
法 解决 3.3 节 转 讨论 的 最 佳 交 易 问 题 。 

假设 第 n 天 的 黄金 价格 为 P(n)， 且 在 第 n 天 卖 出 时 买 入 的 最 佳 交 易 日 为 
B(n)。 如 果 在 第 一 天 卖 出 ， 则 只 能 在 第 一 天 买 入 ， 因 此 B(1) = 1; WR 
在 第 二 天 买 和 信 ， 则 B(2) 可 以 等 于 1 或 2。 

D P(2) <P) 一 BQ2)=2 (在 第 二 天 买 入 ， 第 二 天 卖 出 ) 

D PQ) > P(1) 一 BCQ2)= 1 (在 第 一 天 买 信 ， 第 二 天 卖 出 ) 


第 3 天 前 〈 但 不 包括 第 3 R) 出 现 最 低 价 的 交易 日 为 B2)， 因 此 对 于 BG3): 
口 P(3) < B(2) 交易 日 的 价格 一 B(G3) = 3 











O 我 们 需要 找 出 房间 中 最 高 的 男人 、 最 高 的 女人 以 及 最 高 的 人 。 那 么 ， 是 否 应 该 测 
量 所 有 人 的 身高 以 找 出 最 高 的 人 ， 然 后 测量 每 个 男人 与 每 个 女人 的 里 高， 以 找 出 
最 高 的 男人 与 最 高 的 女人 ? 
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O P(3) > BC) 交易 日 的 价格 一 B(3) = BO 
请 注意 ， 第 4 天 前 出 现 最 低 价 的 交易 日 为 B(3)。 对 于 每 一 个 n，B(n-1) 
实际 上 是 第 n 天 前 出 现 最 低 价 的 交易 日 。 由 此 可 以 将 B(n) 表示 为 : 


BER n, WR P(n) < P(B(n-1)) 
B(n 一 1)， 其 他 





对 于 输入 中 每 一 天 的 所 有 交易 日 组 合 [n B(n)]， 解 是 能 获得 最 大 利润 
的 交易 日 组 合 。 这 种 算法 采用 自 底 癌 上 法 计算 所 有 的 B 值 以 求解 问题 。 
function trade_dp(P) 
B[1] < 1 


sell_day é 1 
best_profit < 0 


for each n from 2 to P. length 
if Pin] EA EE E a 
B[n] cn 
else 
B[n] e B[n-1] 


profit e P[n] - P[B[n]] 

if profit > best profit 
sell_day < n 
best_profit e profit 


return (sell_day, B[sell_day]) 


trade_dp 算法 对 输入 列表 中 的 每 个 元 素 执行 一 组 固定 的 简单 操作 ， 
此 其 时 间 复 杂 度 为 O(n)。 对 前 面 讨论 的 O(n log n) 算法 来 说 ， 上 述 算 法 
在 性 能 上 有 巨大 提升 ， 时 间 复 杂 度 为 O(n ) 的 蛮 力 法 更 是 完全 无 法 与 之 
相 比 。 由 于 辅助 向 量 B 的 元 素 与 输入 一 样 多 ，trade_dp 算法 的 空间 复 
杂 度 同样 为 O(n)。 附 录 将 介绍 另 一 种 空间 复杂 度 为 0(1) 的 算法 ， 它 有 
助 于 减少 计算 机 内 存 的 消耗 。 








3.8 DREMA 


许多 问题 都 涉及 目标 值 的 最 小 化 或 最 大 化 ， 如 寻找 最 短路 径 、 获 取 最 大 





邮 
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AIAS, CIS DICKS, "79 Mt, 90: 
种 称 为 分 支 定 宪 的 策略 ， 它 通过 快速 检测 并 丢弃 不 可 行 的 选择 以 市 省 时 
间 。 为 理解 如 何 检测 不 可 行 的 选择 ， 首 先 需要 了 解 上 界 与 下 界 的 概念 。 


3.8.1 LA5TA 


SZ rn. Tim. ts Linne Je, 
它 保 证 值 必 然 等 于 或 大 于 这 个 界限 。 


次 优 解 通常 不 难 获 得 ， 如 较 短 但 可 能 并 非 最 短 的 路 任 ， 或 较 大 但 可 能 
非 最 大 的 利润 。 次 优 解 为 最 优 解 提供 了 界限 。 例 如 ， 两 地 之 间 的 最 短路 
任 不 会 比 直 线 距 离 更 短 ， 和 直线 中 离 因 此 是 最 短 行驶 距离 的 下 寞 。 


在 3.5 市 区 讨论 的 政 悉 背包 问题 中 ，greedy_knapsack 算法 给 出 的 利润 
是 最 优 利润 的 下 界 ， 它 可 能 接近 (也 可 能 不 接近 ) 最 优 利润 。 现 在 设想 
另 一 种 形式 的 育 包 问题 : 所 有 物品 均 由 粉末 制 成 ， 因 此 我 们 可 以 将 不 是 
整 件 的 物品 疾 入 育 包 。 利 用 贷 心 法 不 难 求解 这 个 问题 ， 即 始终 将 具有 最 
高 价值 /重量 比 的 物品 放 进 背包 。 





function Dowdered _ knapsack(items, max_weight) 

bag_weight e 0 

bag_items e List, new 

items ée sort Dy value weight_ratio(items) 

for each i in items 
weight < min(max_weight - bag_weight, 

1.weight) 

bag_weight e bag weight + weight 
value < weight * i.value weight_ratio 
bagged_value < bagged value + value 
bag_items.append(item, weight) 

return bag_items, bag_value 


如 条 限 定 物品 不 可 分 割 ， 只 会 使 可 能 的 最 大 利润 减少 ， 因 为 我 们 不 得 
不 将 价值 较 低 的 物品 作为 最 后 装 入 背包 的 物品 。 也 就 古 说 ，powdered_ 
knapsack 算法 给 出 了 不 可 分 割 物 品 的 最 优 利润 的 上 界 。™ 


O 消除 问题 限制 的 技术 称 为 松弛 法 ， 它 经 常用 于 计算 最 优化 问题 的 界限 。 
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3.8.2 ”背包 问题 中 的 上 再 与 下 再 


从 之 前 对 青 包 问 题 的 讨论 可 知 ， 求 解 最 优 利润 时 需要 进行 大 量 计算 ， 
算法 的 时 间 复杂 度 为 0(2”)。 但 是 ， 可 以 利用 powdered_knapsack H 
greedy_knapsack 算法 快速 获取 最 优 利润 中 的 上 界 与 下 界 。 我 们 选取 
若干 样本 值 尝试 一 下 。 





物品 价值 重量 价值 /重量 比 最 大 容量 
A 20 5 4.00 

B 19 4 475 

C 16 2 8.00 m 
D 14 5 2.80 

E 13 3 4.33 

F 9 2 4.50 

个 52 439 


DP 


物品 在 装 入 背包 前 的 情况 如 上 图 所 示 。 第 一 个 方 框 表示 不 考虑 装 入 背 
包 的 物品 ， 第 二 个 方 框 表示 背包 的 可 用 容量 以 及 所 容纳 的 物品 。 运 行 
greedy_knapsack 算法 所 得 的 利润 为 39， 而 运行 powdered_knapsack 
算法 所 得 的 利 调 为 52.66， 这 意味 着 最 优 利润 介 于 39 与 52 之 间 。 根 据 
3.6 廊 的 讨论 ， 可 以 将 这 个 包含 n 件 物品 的 问题 分 解 为 两 个 包含 n -1 件 
物品 的 子 问 题 。 第 一 个 子 回 题 萎 虑 将 编号 为 A 的 物品 装 入 背包 ， 而 第 
本 个 子 问题 不 考虑 将 编写 为 A DIAS A E. 











F50 $39 





pod v: 
我 们 计算 两 个 子 问 题 的 上 界 与 下 界 。 由 于 其 中 一 个 子 问 题 的 下 界 为 48， 
最 优 解 介 于 48 5 52 之 间 。 继 续 探 索 右 侧 的 子 问 题 ， 它 的 界限 较为 有 趣 。 
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ME, MiA MAFRA FEA REKER. Ok lr T E 


行 分 解 。 
Gel , 
DEG HIR. ep 
gës: 
回回 回 





四 日 DH 
BDHY: 
B YX B X 
不 47 Aan 不 49 449 个 48 $33 个 46 Ka 
De," (DA v- DG v: DO 
我 们 现在 可 以 得 出 一 些 重 要 的 结论 。 从 突出 显示 的 子 回 题 可 以 看 到 ， 其 
上 界 与 下 春 均 为 49， 即 这 个 子 问 题 的 最 优 利 调 必须 恰好 为 49。 此 外 ， 
对 于 疝 待 探索 的 子 回 题 ， 它 们 所 有 分 支 的 上 界 均 小 于 49。 其 他 子 问 题 


分 支 都 无 法 提供 比 49 更 好 的 利润 ， 这 意味 着 我 们 可 以 从 搜索 中 删除 这 
些 分 支 。 

合理 运用 上 界 与 下 界 有 助 于 以 最 少 的 计算 量 找 出 最 优 利润 。 在 探索 各 种 
可 能 性 时 ， 我 们 动态 地 调整 了 搜索 空间 。 分 支 定 界 法 的 应 用 总 结 如 下 ， 
(1) 将 问题 分 解 为 若干 子 问题 ， 

O 找 出 每 个 子 问题 的 上 界 与 下 界 ， 

G) 比较 所 有 分 支 的 界限 ， 
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(4) 对 了 最 可 行 的 子 问题 重复 第 1 步 。 


读者 或 许 还 记得 ， 利 用 3.4 节 讨 论 的 回 渊 策略 也 能 求解 ， 不 必 探 索 每 个 
可 能 的 候选 解 。 我 们 在 尽 可 能 探索 路 径 后 将 它们 删除 ， 并 在 获得 某 个 合 
适 的 解 后 停止 搜索 。 分 支 定 界 法 有 助 于 预测 最 差 的 路 径 ， 避 免 在 这 些 路 
12 EIR EFH]. 


3.9 人 小结 


解决 问题 的 过 程 症 从 可 能 的 解 空 间 中 寻找 正确 解 的 过 程 。 这 一 草 介 绍 
多 种 方法 ， 弯 力 法 最 为 向 单 ， 它 通过 逐个 检验 搜索 空间 的 元 素 求 解 问题 。 


系统 地 将 问题 分 解 为 更 小 的 问题 能 显著 提高 性 能 。 反 复分解 问题 通 第 涉 
及 对 相同 子 问 题 的 处 理 ， 这 种 情况 下 ， 利 用 动态 规划 避免 重复 执行 相同 
的 计算 至 关 重 要 。 

这 一 草 还 介绍 了 回调 法 如 何 优化 亲 些 类 型 的 弯 力 搜索 。 对 于 可 以 佑 计 上 
界 或 下 寞 的 问题 ,利用 分 支 定 界 法 能 缩短 求解 时 间 。 当 计算 最 优 解 的 成 
本 过 高 时 ， 不 妨 采 用 局 发 法 。 


这 一 草 讨 论 的 所 有 党 略 均 用 于 数据 操作 。 接 下 来 将 介绍 计算 机 内 存 中 了 最 
前 见 的 数据 组 织 方 式 ， 以 及 它们 如 何 影响 最 笛 见 的 数据 操作 的 性 能 。 





ssa lr 
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优秀 的 程序 员 担心 数据 结构 和 它们 之 间 的 关系 。 
一 一 林 纳 斯 托 瓦 效 


控制 数据 对 于 计算 机 科学 的 重要 性 萎 良 置疑 : 计算 过 程 由 数据 操作 构 
成 ， 这 些 操作 将 输入 转换 为 输出 。 但 算法 通 贡 不 会 指定 如 何 执行 数据 
操作 。 例 如 ，merge 算法 (3.117) 依靠 未 指定 的 外 部 代码 来 创建 数字 
列表 、 检 查 列表 是 否 为 空 并 为 列表 添加 元 素 。 与 之 类 似 ，queens 算法 
3.40) 并 不 关心 棋盘 上 的 操作 以 及 棋子 位 置 在 内 存 中 的 存储 方式 。 这 
些 细 习 都 隐 叫 在 我 们 称 之 为 抽象 的 背后 。 这 一 半 将 讨论 以 下 内 容 : 


+ 抽象 数据 类 型 如 何 保 持 代 码 的 整洁 
多 需要 稳 握 的 常见 抽象 
E" 在 内 存 中 构造 数据 的 不 同方 式 


在 讨论 开始 之 前 ， 我 们 首先 需要 理解 “抽象 ”与 “数据 类 型 ”这 两 个 术 
语 的 含义 。 


抽象 


抽象 省 略 了 细 ， 它 古 一 种 采用 侧 单 方式 获取 复杂 事物 功能 的 接口 。 以 

汽车 为 例 ， 复 杂 的 机 械 构造 被 隐藏 在 仪表 盘 之 后 ， 使 得 任何 人 都 能 轻松 

学 习 驾 驶 而 无 须 了 解 工 程 方面 的 细节 问题 。 

在 软件 领域 ,过 程 抽象 将 过 程 的 复杂 性 隐 成 在 过 程 调 用 之 后 。 例 如 ， 

trade 算法 (3.6 1) 中 的 min 与 max 过 程 并 未 展示 如 何 查找 最 小 值 与 
O 林 纳 斯 . 托 瓦 兹 (1969 一 ”)， 芬 兰 毅 美国 软件 工程 师 ，Linux 内 核 与 Git 的 缔造 者 


和 主要 开发 者 ， 是 全 球 最 著名 的 程序 员 之 一 。 托 瓦 兹 末 淮 等身，1996 年 发 现 的 一 蜂 小 
行星 也 以 他 的 名 字 命 名 。 目 传 《 只 是 为 了 好 玩 》 详 细 介绍 了 他 的 生平 。 一 一 译 者 注 
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最 大 值 ， 使 得 算法 更 为 简 单 。 我 们 可 以 通过 位 于 其 他 抽象 之 上 的 抽象 构 
建 模块 ”“， 从 而 利用 单一 过 程 执 行 复杂 的 任务 ， 例 如 : 


html e fetch_source("https://code.energy") 
仅 需 一 行 代码 就 能 获取 网 站 的 源 代 码 一 一 尽管 其 内 部 机 制 极 为 复杂 。” 


这 一 草 将 重点 讨论 数据 抽象 ， 它 隐 震 了 数据 处 理 过 程 的 细 菩 。 但 在 理解 
数据 抽象 的 工作 机 制 忆 前， 先 来 巩固 一 下 对 数据 类 型 的 认识 。 





效 据 拓 型 
我 们 根据 对 紧 固件 〈 如 螺钉 、 螺 检 与 钉子 ) 进行 的 操作 (如 拧紧 、 紧 


E, EA) 来 区 分 它们 。 与 之 类 似 ， 可 以 根据 对 数据 执行 的 操作 来 区 分 
不 同类 型 的 数据 。 


以 数据 变量 为 例 ， 如 采 变 量 可 以 分 解 为 位 置 字符 、 进 行 大 小 写 转换 、 接 
收 附加 字符 ， 则 它 属 于 字符 串 型 ， 字 符 串 代表 文本 ， 如 果 变 量 可 以 反 
转 、 执 行 XOR/OR/AND 操作 ， 则 它 属 于 布尔 型 ， 布 尔 值 可 以 为 True 或 
False; 如 采 变 量 可 以 进行 加 法 、 减 法 、 除 法 操作 ， 则 它 属于 数值 型 。 


每 种 数据 类 型 与 一 组 特定 的 过 程 相 关 。 对 于 存储 列表 、 集 合 、 数 字 的 变 
量 ， 处 理 它 们 的 过 程 各 不 相同 。 





4.1 抽象 数据 类 型 


对 于 给 定 的 数据 类 型 ， 抽 象 数据 类 型 (ADT) 是 一 组 有 意义 的 操作 规 
W. ADT 定义 的 接口 用 于 处 理 保存 给 定 类 型 数据 的 变量 一 一 数据 在 内 
存 中 存储 与 操作 的 所 有 细 广 都 被 隐藏 起 来 。 


算法 对 数据 进行 操作 时 ， 并 非 直 接 指 示 计 算 机 内 存 的 读 写 ， 而 是 采用 外 
部 数据 处 理 模块 ， 它 提供 了 定义 在 ADT 中 的 过 程 。 











O 模块 (RE) 是 一 种 提供 通用 计算 过 程 的 软件 ， 可 以 根据 需要 包含 在 其 他 软件 中 。 
© 涉及 解析 域名 、 创 建 TCP 网 络 套 接 字 、 进 行 SSL 加 密 提 手 等 多 种 操作 。 
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例如 ， 为 操作 存储 列表 的 变量 ,我们 需要 : 创建 与 删除 列表 的 过 程 ， 访 
ERMIR RE n 个 元 泰 的 过 程 ， 疝 列表 添加 新 元 素 的 过 程 。 这 些 过 
程 的 定义 (名 称 与 用 途 ) 就 古 一 种 列表 ADT。 我 们 可 以 完全 依靠 这 些 
过 程 来 处 理 列表 ， 而 不 必 和 直接 对 计算 机 内 存 进行 操作 。 





使 用 ADT 的 优点 


HE ADT 使 代码 更 容易 理解 和 修改 。 不 芳 虑 数据 处 理 过程 中 的 各 种 
细 证 ， 我 们 可 以 专注 于 从 宏观 层面 萎 卡 算法 求解 问题 的 过 程 。 


灵活 ”可 以 采用 不 同 的 方法 在 内 存 中 构造 数据 ， 因 此 可 以 为 同一 种 数据 
类 型 创建 不 同 的 数据 处 理 模 块 。 应 根据 实际 情况 做 出 最 佳 选 择 。 由 于 实 
现 相同 ADT 的 模块 将 提供 相同 的 过 程 ， 只 要 换 用 不 同 的 数据 处 理 模块 ， 
就 能 改变 数据 的 存储 与 操作 方式 。 汽 车 与 之 类 似 : 电动 汽车 与 燃油 汽车 
的 驾驶 界面 并 无 不 同 ， 任 何 会 开车 的 人 都 能 瞩 不 费力 地 区 驶 两 种 汽车 。 


可 重用 性 ”如 琳 多 个 项 目 需要 处 理 相 同类 型 的 数据 ， 可 以 在 这 些 项 目 中 
使 用 相同 的 数据 处 理 模 块 。 以 第 3 ewen) power zer 与 recursive-_ 
power_set 算法 为 例 ， 二 者 都 需要 对 表示 集合 的 变量 进行 操作 ， 这 意味 
着 可 以 在 两 种 算法 中 使 用 相同 的 Set 模块 。 


组 织 ”我 们 经 常 需要 对 数字 、 文 本 、 地 理 坐 标 、 图 像 等 各 种 数据 类 型 进 
行 操 作 。 为 更 好 地 组 织 代 码 ， 可 以 创建 不 同 的 模块 ， 每 种 模块 包含 特定 
于 一 种 数据 类 型 的 代码 。 这 就 十 所 谓 的 关注 点 分 离 ， 即 应 将 处 理 相同 地 
辑 问 题 的 代码 置 于 相互 独立 的 模块 中 。 如 琳 实 现 不 同 功 能 的 代码 纠缠 在 
一 起 ， 右 会 出 现 所 请 的 面条 式 代 码 。 


便捷 我 们 可 以 获取 他 人 编写 的 数据 处 理 模 块 ， 人 研究 如 何 使 用 由 ADT 
定义 的 过 程 ， 之 后 马上 就 能 利用 这 些 过 程 对 其 他 数据 类 型 的 变量 进行 操 
作 ， 而 无 顷 了 解数 据 处 理 模块 的 工作 机 制 。 

漏洞 修复 ”如 采 使 用 的 数据 处 理 模 块 蕊 无形 间 ， 代 码 将 免 受 数 据 处 理 馆 
误 的 困扰 。 如 末 发 现 数据 处 理 模 块 中 存在 漏洞 ， 修 复 它 就 意味 着 修复 了 
所 有 受 该 漏 筒 影响 的 代码 。 
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4.2 Sum 


为 求解 计算 问题 ， 了 解 所 处 理 的 数据 类 型 以 及 需要 对 数据 类 型 执行 的 操 
作 至 关 重 要 ， 确定 计划 使 用 的 ADT 也 同样 重要 。 这 一 市 将 介绍 一 些 需 
要 向 握 的 知名 抽象 数据 类 型 ， 它 们 不 仅 出 现在 大 量 算法 中 ， 许 多 编程 语 
言 也 提供 对 这 些 类 型 条 内 和 转 支 持 。 


4.2.1 基本 数据 类 型 


基本 数据 类 型 古 编 程 语言 内 置 支持 的 数据 类 型 ， 无 须 调用 外 部 模块 即 可 
使 用 。 基 本 数据 类 型 总 是 包括 整数 、 尝 点数” 以 及 对 它们 的 一 般 性 操作 
(加 法 、 减 法 、 除 法 )， 大 部 分 语言 还 内 置 支持 在 变量 中 存储 文本 、 布 尔 
值 以 及 其 他 简单 的 数据 类 型 。 





4.2.2 $% 


设想 一 堆 文 件 : 我 们 可 以 将 一 份 文件 放 在 顶部 ， 或 从 顶部 取 走 一 份 文 
件 ， 而 第 一 份 放 入 的 文件 总 古 最 后 才 被 取 走 。 栈 用 于 处 理 一 堆 元 素 ， 它 
只 对 栈 顶 的 元 素 进 行 操作 。 请 注意 ， 栈 顶 的 元 素 总 是 最 近 插 入 栈 中 的 元 
素 。 栈 的 实现 必须 包括 至 少 两 种 操作 。 


O push(e) : 将 元 素 e 添加 到 栈 顶 。 
o pop(): 检索 并 删除 栈 顶 的 元 素 。 


更 “高 级 “的 栈 可 以 捉 供 更 多 的 操作 ， 如 检查 栈 是 否 为 空 ， 或 者 犹 取 栈 
中 当前 元 素 的 数量 。 


以 这 种 方式 处 理 数 据 称 为 后 进 先 出 (LIFO) : 我 们 只 删除 栈 顶 的 元 素 ， 
它 忆 古 最 近 插 入 栈 中 的 元 素 。 栈 古 许 多 算法 使 用 的 重要 数据 类 型 。 以 文 
本 编辑 器 的 “撤销 ”功能 为 例 ， 编 辑 者 创建 的 每 个 版 本 都 被 压 入 栈 中 ， 
如 琳 需 要 撤销 ， 文 本 编辑 融 从 栈 中 弹出 一 个 版 本 并 将 其 恢复 。 








O 浮 点 数 通常 用 于 表示 带 有 小 数 的 数字 。 
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为 实现 无 递归 算法 的 回溯 (3.4 节 )， 必 须 记 住 到 达 栈 当前 位 置 的 那些 先 
择 。 在 探索 新 结 点 时 ， 我 们 将 对 该 结 点 的 引用 压 入 栈 中 ， 返 回 时 ， 只 需 
从 栈 中 弹出 就 能 获取 对 返回 位 置 的 引用 。 


4.2.3 BAJI 


队列 与 栈 有 所 不 同 。 它 同伴 用 于 存储 与 检索 元 素 ， 但 检索 到 的 元 北 总 走 
位 于 队列 前 端的 元 素 ， 即 队列 中 存在 时 间 最 长 的 元 素 。 如 末 对 此 感到 困 
惑 ， 请 设想 现实 生活 中 在 餐厅 等 侯 的 人 群 ， 抽 象 数据 类 型 中 的 队列 与 之 
类 似 。 队 列 包括 两 种 基本 操作 。 


口 enqueue (e): 将 元 素 e 添加 到 队列 后 端 。 
D dequeue() : 删除 队列 前 端的 元 素 。 


队列 采用 先进 先 出 (FIFO) 的 方式 组 织 数据 ， 因 为 插入 队列 中 的 第 一 个 
TR (也 是 存在 时 间 最 长 的 元 素 ) 总 是 第 一 个 离开 队列 。 

不 少 计算 场景 都 会 用 到 队列 。 以 开发 在 线 披 院 服务 为 例 ， 我 们 可 能 会 将 
披 院 订单 存储 在 队列 中 。 作 为 练习 ， 请 读者 思考 以 下 问题 : 如 采 披 联 餐 
厅 采 用 栈 而 不 是 队列 处 理 订 单 ， 两 种 方式 有 何不 同 ? 











4.2.4 优先 队列 


优先 队列 与 队列 类 似 ， 不 同 书 处 在 于 必须 为 进入 队列 的 元 率 分 配 一 个 优 
先 级 。 在 医院 等 候 医疗 护理 服务 的 病人 十 优 移 队 列 在 现实 生活 中 的 一 个 
示例 : 危重 病人 的 优先 级 最 高 并 直接 进入 队列 前 问 ， 较 轻 的 病 患 则 排 在 
队列 后 端 。 优 先 队 列 包 括 以 下 操作 。 


D enqueue(e, p): 根据 优先 级 p 将 元 素 e 添加 到 队列 。 
D dequeue() : 删除 并 返回 队列 前 端的 元 素 。 


计算 机 通常 包括 许多 正在 运行 的 进程 ， 但 执行 进程 的 CPU 只 有 一 个 
(或 几 个 )。 操 作 系 统 采 用 优先 队列 来 组 织 所 有 等 待 执 行 的 进程 ， 它 为 队 
列 中 等 等 的 每 个 进程 分 配 一 个 优先 级 。 操 作 系 统 将 一 个 进程 从 队列 中 取 
出 并 运行 一 段 时 间 ， 如 末 该 进程 没有 执行 完毕 ， 它 将 再 次 进入 队列 。 操 
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作 系 统 会 不 断 重复 这 一 过 程 。 


对 时 效 性 要 求 很 高 的 进程 将 立即 获得 CPU 时 间 ， 而 其 他 进程 在 队列 中 
竺 待 的 时 间 更 长 。 从 键盘 接收 输入 的 进程 通 第 会 获得 极 高 的 优先 级 : 如 
末 键 盘 停 止 啊 应 ， 用 户 可 能 会 认为 计算 机 员 并 并 试图 重启 ， 这 在 任何 情 
况 下 都 并 非 最 佳 选 择 。 


4.2.5 ”列表 


在 存储 大 量 元 素 时 ， 有 时 和 需要 更 高 的 灵活 性 。 例 如 ， 我 们 希望 不 受 限 制 
地 将 元 素 重 新 排序 ， 或 对 任何 位 置 的 元 素 进 行 访 问 、 插 入 与 删除 操作 ， 
此 时 采用 列表 就 很 方便 。 列 表 ADT 通常 定义 了 以 下 操作 。 

D insert(n, e): 将 元 素 e 插入 位 置 n。 

口 remove(n) : 删除 位 置 n MTE. 

O get(n) : 获取 位 置 n 的 元 素 。 
口 
E 











sort() : KIRPA. 
slice(start, end): 返回 从 位 置 start 到 位 置 end 之 间 的 子 列表 
切片 。 

Q reverse(): 反 转 列表 的 顺序 。 


列表 是 最 肖 用 的 ADT 之 一 。 例 如 ， 如 末 需 要 存储 系统 中 最 第 访问 的 文 
件 链接 ， 那 么 列表 将 是 理想 之 选 ， 我 们 可 以 将 链接 排序 以 方便 显示 ， 并 
在 菜 些 文件 的 访问 频率 降低 时 删除 相应 有 的 链 接 。 


如 采 不 需要 列表 的 这 种 灵活 性 ， 应 将 栈 或 队列 作为 数据 类 型 的 首选 。 采 
用 更 简单 的 ADT 不 仅 能 确保 以 严谨 稳健 的 方式 (FIFO 或 LIFO) 处 理 数 
据 ， 也 使 代码 更 容易 理解 。 例 如 ， 栈 的 结构 有 助 于 理解 数据 进出 的 方式 。 


4.2.6 ”排序 列表 


如 采 需 要 维护 一 个 始终 保持 排序 状态 的 元 系列 表 ， 排 序列 表 将 派 上 用 
场 。 信 由 这 种 数据 类 型 ， 我 们 不 必 在 每 次 插入 操作 前 确定 正确 的 位 置 
(并 定期 对 列表 手动 排序 )。 疝 排序 列表 中 插入 元 素 时 ， 列 表 总 是 会 保持 
排序 状态 。 对 排序 列表 的 任何 操作 都 无 法 使 元 素 重 新 排序 ， 即 列表 保证 
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能 始终 处 于 排序 状态 。 与 列表 相 比 ， 排 序列 表 的 操作 要 少 得 多 。 


D insert(e) : KICA e 插入 正确 的 位 置 。 
O remove(n): 删除 位 置 n 的 元 素 。 
O get(n) : 获取 位 置 n 的 元 素 。 


4.2.7 映射 


上 映射“〈 即 字典 ) 用 于 存储 两 个 对 象 〈 键 对 象 与 值 对 象 ) 之 间 的 映射 关 
系 。 可 以 通过 键 来 查询 映射 ， 并 获取 其 关联 的 值 。 例 如 ， 我 们 使 用 映射 
将 用 户 的 ID 志和 全 名 分 别 保存 为 键 和 值 。 当 给 定 用 户 的 ID 号 上 时， 映射 
将 返回 关联 的 用 户 名 。 映 射 定义 的 操作 如 下 。 

口 set(key, value): 添加 键 值 映射 。 


D delete(key): 有 删除 键 key 及 其 关联 的 值 。 
O get (key): 检索 与 键 key 关联 的 值 。 





4.28 ”集合 


集合 是 奋 干 唯一 元 系 的 无 序 组 合 ， 如 附 孙 描述 的 数学 集合 。 如 采 符 存储 
元 素 的 顺序 无 天 基 要 ， 或 必须 确保 所 有 元 素 只 能 出 现 一 次 ， 则 可 以 使 用 
集合 。 第 用 有 的 集合 操作 如 下 。 


O add(e) : 问 集 合 添 加 元 素 ， 如 采 元 素 已 在 集合 中 则 提示 错误 。 
D List(): 列 出 集合 中 的 元 素 。 
O delete(e): 从 集合 中 删除 元 素 e。 


程序 员 利 用 上 面 介绍 的 这 些 ADT 来 实现 数据 的 交互 ， 如 同 驾驶 员 使 用 
仪表 盘 驾 驶 汽车 一 样 。 下 一 证 将 探讨 仪表 盘 背 后 的 电路 结构 。 





4.3 数据 结构 


抽象 数据 类 型 仅 描 述 了 如 何 操作 给 定数 据 类 型 的 变量 。 它 虽然 定义 了 一 
系列 数据 操作 ， 但 并 未 解释 这 些 操作 是 如 何 进行 的 。 而 数据 结构 描述 了 
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数据 在 计算 机 内 存 中 的 组 织 与 访问 方式 ， 并 提供 了 在 数据 处 理 模 块 中 实 
现 ADT 的 方法 。 

数据 结构 不 同 ，ADT 的 实现 方式 也 有 所 不 同 。 根 据 需 要 选择 使 用 最 佳 
数据 结构 的 ADT 实现 方式 ， 对 于 创建 高 效 的 计算 机 程序 至 关 重 要 。 接 
下 来 ， 我 们 将 介绍 一 些 最 第 用 的 数据 结构 ， 并 分 析 它 们 的 优 缺 点 。 











4.3.1 数组 


如 来 需要 在 计算 机 内 存 中 存储 大 量 元 素 ， 使 用 数组 是 最 人 简单 的 方式 。 害 
义 数 组 时 ， 系 统 在 内 存 中 分 配 连续 的 存储 空间 ， 然 后 按 顺 序 将 元 素 写 入 
该 空间 ， 并 采用 特殊 的 NULL 令 牌 标记 序列 的 结束 。 


数组 中 每 个 对 象 所 后 的 存储 空间 相同 。 假 议 茶 个 数组 从 存储 地 址 s FF 
合 ， 每 个 元 素 的 长 度 为 5 字 习 。 如 玉 需 要 访问 数组 的 第 n 个 元 素 ， 从 地 
hE s + (b x n) 开始 取 出 5 季 市 即 可 。 








存储 内 容 


JL iber) 


存储 地 址 





图 4-1 计算 机 内 存 中 的 数组 


因此 ， 我 们 能 立即 访问 数组 中 的 任何 元 素 。 数 组 在 实现 栈 时 极为 有 用 ， 
也 能 用 于 实现 列表 与 队列 。 数 组 多 于 编写 且 可 以 即时 访问 ， 但 同样 存在 
局 限 性 。 


首先 ， 在 内 存 中 分 配 大 量 的 连续 空间 并 不 现实 ， 如 来 需要 对 数组 扩展 ， 
那么 内 存 中 可 能 没有 足够 的 可 用 空间 。 其 次 ， 删 除数 组 中 间 的 元 素 时 会 
出 现 问题 : 我 们 必须 将 之 后 的 所 有 元 素 后 移 ， 或 将 已 删除 元 素 的 存储 空 
间 标 记 为 “不 可 用 ， 但 两 种 方案 均 不 可 取 。 与 乙 类 似 ， 辐 数组 添加 元 
素 时 ， 需 要 将 之 后 的 所 有 元 素 前 移 。 
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4.3.2 ”链表 


链表 的 元 素 保 存在 不 必 位 于 连续 存储 地 址 的 单元 链 中 ， 所 有 单元 的 内 存 
是 按 需 分 配 的 。 每 个 单元 包 o 指向 链 中 下 一 个 单元 的 地 址 ， 
包含 至 指针 的 单元 标记 了 链 的 结 


OE EOE E e a 
C 1o JC | C2 |[ 26: 27 | | 35 | 
图 4-2 计算 机 内 存 中 的 链表 


可 以 利用 链表 实现 栈 、 列 表 以 及 队列 。 链 表 规 模 增 长 并 无 大 碍 ， 因 为 每 
个 单元 可 以 保存 在 内 存 的 任何 位 置 。 换 言 之 ， 链 表 规 模 取 决 于 可 用 的 内 
存 容 量 。 此 外 ， 通 过 调整 单元 的 指针 ， 很 容易 就 能 在 链表 中 插入 或 删除 
元 素 。 

















图 4-3 在 B 与 C 之 间 插 入 元 素 ; 删除 C 


链表 的 不 足 之 处 在 于 无 法 立即 检索 到 第 n 个 元 素 。 我 们 必须 从 这 一 个 单 
元 开始 搜索 ， 通 过 沉 一 个 单元 的 指针 获取 第 二 个 单元 的 地 址 ， 从 而 找到 
第 二 个 单元 ， 然后 通过 第 二 个 单元 的 指针 获取 下 一 个 单元 的 地 址 ， 以 此 
类 推 ， 直 至 检索 到 第 却 个 单元 。 


此 外 ， 如 琳 只 给 出 一 个 单元 的 地 址 ， 则 很 难 删除 该 单元 或 党 单 元 链 问 后 
移动 。 在 没有 其 他 信忠 的 情况 下 ， 无 法 获取 链 中 前 一 个 单元 的 地 址 。 
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4.3.3 NEBR 


双向 链表 是 一 种 特殊 的 链表 ， 每 个 单元 包含 两 个 指针 ， 分 别 指 癌 前 一 个 
单元 与 后 一 个 单元 。 





-10 JC | -25 |C 26 |[ 27 35 | 
图 4-4 ”计算 机 内 存 中 的 双向 链表 
双 问 链表 与 链表 的 优点 相同 。 由 于 新 单元 的 存储 空间 可 以 按 需 分 配 ， 不 必 
进行 大 量 的 内 存 预 分 配 操作 。 借 由 两 个 指针 ， 不 仅 可 以 沿 单元 链 癌 前 移动 ， 
也 可 以 辣 后 移动 。 即 便 只 给 出 一 个 单元 的 地 址 ， 同 样 可 以 删除 这 个 单元 。 
但 是 ， 仍 然 无 法 立即 访问 第 nn 个 元 素 。 些 外， 每 个 单元 保存 两 个 指针 将 
增加 代码 的 复杂 性 ， 且 需要 更 多 的 内 存 来 存储 数据 。 











4.3.4 ”数组 与 链表 的 比较 


功能 丰富 的 编程 语言 通 第 提供 对 列表 、 队 列 、 栈 以 及 其 他 ADT HAE 
实现 ， 这 些 实现 一 般 采 用 某 种 默认 的 数据 结构 。 根 据 数据 的 访问 方式 ， 
茶 些 实现 其 至 能 在 运行 时 目 动 切换 数据 结构 。 


对 性 能 要 求 不 高 时 ， 我 们 可 以 依靠 这 些 通用 的 ADT 实现 而 不 必 担 心 数 
据 结构 。 但 如 末 需 要 最 大 限度 提高 性 能 ， 或 采用 功能 不 够 丰富 的 低级 语 
言 编 写 程序 ， 则 必须 决定 使 用 哪 种 数据 结构 。 应 分 析 必 须 对 数据 执行 的 
操作 ， 并 选择 使 用 合适 数据 结构 的 实现 。 链 表 在 以 下 情况 下 优 于 数组 : 
DO 要 求 极 快 的 元 素 插入 或 删除 速度 ， 

D 不 需要 对 数据 进行 随机 的 无 序 访问 ， 

O 在 列表 的 中 间 位 置 插入 或 删除 元 素 ; 

D 无 法 准确 评估 列表 规模 (列表 在 执行 过 程 中 需要 增加 或 减少 )。 


数组 在 以 下 情况 下 优 于 链表 : 
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DO 需要 经 第 对 数据 进行 随机 和 无 序 的 访问 ，; 

需要 极致 的 性 能 以 访问 元 素 ; 

D 元 素数 量 在 执行 过 程 中 不 会 发 生变 化 ， 因 此 很 容易 就 能 分 配 连 续 的 
计算 机 存储 空间 。 


4.3.5 j 


与 链表 类 似 ， 树 的 对 象 存储 在 不 必 位 于 连续 物理 地 址 的 单元 中 ， 每 个 单 
元 同样 包含 指向 其 他 单元 的 指针 。 但 与 链表 不 同 ， 这 些 单元 及 其 指针 并 
韭 按 线性 的 单元 链 排 询 ， 而 是 呈 树 状 结构 。 树 特别 适合 你 存 文件 目录 结 
构 、 苗 队 的 命令 链 等 具有 层次 天 系 的 数据 。 
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法 尔 西 语 | | 库尔德 语 | | 孟加拉 语 乌 尔 都 语 
图 4-5” 印 欧 语系 起 源 树 


在 摘 述 树 的 术语 中 ， 单 元 称 为 结 点 ， 从 一 个 单元 指 问 劝 一 个 单元 的 指针 
称 为 边 。 位 于 树 项 端的 结 点 称 为 根 结 点 ， 它 是 唯一 没有 父 结 点 的 结 点 。 
除根 结 点 外 ， 树 中 的 所 有 结 点 只 能 有 一 个 父 结 点 。” 

具有 相同 父 结扎 的 两 个 结 氮 互 为 兄 辑 结扎 。 一 个 结 所 的 父 结 氮 、 祖 父 结 
点 、 曾 祖父 结 点 〈 直 至 根 结 点 ) 构成 该 结 点 的 祖先 ， 同样 地 ， 一 个 结 点 
的 子 结 点 、 孙 结 点 、 曾 孙 结 点 《直至 树 的 底部 ) 都 是 该 结 点 的 子孙 。 


没有 任何 子 结 点 的 结 点 称 为 叶 结 点 (想象 实际 的 树叶 合 )。 两 个 结 点 之 
站 的 路 径 是 从 一 个 结 点 到 男 一 个 结 皮 的 一 组 结 皮 与 边 。 








O 如 果 某 个 结 点 违反 这 一 原则 ， 树 的 许多 搜索 算法 将 无 法 实现 。 





结 点 的 层次 是 该 结 ne i 
MAJEE. So, WEARI. 
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层次 4 








图 4-6 树 中 的 叶 结 点 表示 目前 的 语言 


4.3.6 ”二 叉 查 找 树 


二 又 查 找 树 古 一 种 能 实现 高 效 搜索 的 特殊 树 结构 。 树 中 的 结 点 最 多 可 以 
有 两 个 子 结 后 ， 根 据 结 反 的 键 值 对 确定 其 位 置 。 父 结 反 左 侧 的 子 结 扩 必 
须 小 于 父 结 护 ， 而 右 侧 的 子 结 皮 必须 大 于 父 结 扩 。 





图 4-7 二 又 查找 树 示 例 
如 果树 遵循 上 述 规 则 ， 就 很 容易 在 树 中 搜索 具有 给 定 键 值 对 的 某 个 结 点 。 


function find_node(binary_tree, value) 
node < binary_tree.root_node 
while node: 
if node.value = value 
return node 
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if value > node.value 
node ¢ node.right 
else 
node ¢ node. Left 
return "NOT FOUND" 


插入 元 素 时 ， 我 们 对 希望 插入 树 中 的 值 进行 搜 索 。 采 用 搜索 中 探索 的 最 
后 一 个 结 皮 ， 并 使 其 右 指针 或 左 指针 指 问 新 结 护 。 


function insert_node(binary_tree, new_node) 
node < binary_tree.root_node 
while node: 
Last_node < node 
if new_node.value > node.value 
node e node.right 
else 
node ¢ node. left 
if new_node.value > last_node.value 
Last_node.right e new_node 
else 
last_node.left ¢ new_node 


树 的 平衡 ”如 末 二 又 查 找 树 中 插入 的 结 点 过 多 ， 最 终 将 得 到 一 棵 极 高 的 
树 ， 其 中 不 少 结 点 仅 有 一 个 子 结 点 。 例 如 ， 当 插入 结 点 的 键 值 对 总 古 大 
于 前 一 个 结 点 的 键 值 对 时 ， 了 最 后 得 到 的 数据 结构 将 更 接近 于 链表 。 不 
过 ， 我 们 可 以 通过 重新 排列 树 中 的 结 点 来 降低 其 高 度 ， 这 种 操作 称 为 树 
的 平衡 。 一 棵 完美 的 平衡 树 上 共有 最 小 的 可 能 高 度 。 





图 4-8 同一 棵 二 又 查找 树 的 3 种 形式 : 极 不 平衡 ( 左 )、 较 为 平衡 (中)、 完 
美 平衡 (A) 


72 | SAS 数 F 


树 的 大 部 分 操作 涉及 跟踪 结 点 之 间 的 链接 ， 直 至 找到 某 个 特定 的 结 斥 。 
树 的 高 度 越 高 ， 结 点 之 间 的 平均 路 径 越 长 ， 需 要 访问 内 存 的 次 数 越 多 。 
鉴于 此 ， 降 低 树 的 高 度 至 关 重 要 。 根 据 已 排序 的 结 点 列表 ， 可 以 采用 
以 下 方式 构建 一 棵 完美 的 平衡 二 又 查找 树 。 
function build_balanced (nodes) 
if nodes is empty 
return NULL 

middle e nodes. length/2 

left ¢ nodes.slice(0, middle - 1) 

right e nodes.slice(middle + 1, nodes. length) 

balanced ¢ BinaryTree.new(root=nodes[middle]) 

balanced. left ¢ build_balanced(left) 

balanced.right e build_balanced(right) 

return balanced 
旁 虑 一 棵 由 nn 个 结 扣 构成 的 二 又 查找 树 ， 它 的 最 大 高 度 为 n， 此 时 它 类 
似 于 一 个 链表 。 妆 树 达 到 完美 平衡 时 ， 其 最 小 高 度 为 log, ne ZC Së 
找 树 中 搜索 某 个 元 素 的 复杂 度 与 树 的 高 度 成 正比 。 最 坏 情况 下 ， 必 须 搜 
索 到 最 低层 次 ( 叶 结 点 ) 才能 找到 指定 元 素 。 因 此 ， 搜 索 由 n 个 元 素 构 
成 的 平衡 二 又 查找 树 ， 其 时 间 复 杂 度 为 O(log n)。 这 就 古 经 党 选择 这 种 
数据 结构 来 实现 集合 〈 需 要 查找 元 素 是 否 已 经 存在 ) 与 映射 (需要 查找 
键 值 对 ) 的 原因 。 


然而 ， 由 于 需要 将 所 有 结 点 排序 ， 树 的 平衡 操作 成 本 很 高 。 如 采 每 次 插 
入 或 删除 元 又 后 都 对 树 进行 再 平衡 ， 将 显著 降低 操作 速度 。 一 般 来 说 ， 
在 多 次 插入 与 删除 操作 后 才 需 要 对 树 进 行 平 衡 。 不 过 ， 仅 当 笛 很 少 发 生 
变化 时 ， 时 第 进行 平衡 操作 会 定 合理 的 选择 。 


为 有 效 处 理 变 化 很 大 的 二 又 树 ， 人 人 们 发 明了 上 自 平 衡 二 又 树 ， 它 在 插入 或 
删除 元 素 时 将 保持 平衡 状态 。 红 黑 树 古 一 种 得 名 的 目 平 衡 树 ， 它 采用 
“ 红 ” 或 “ 黑 ” 为 结 点 着 色 来 表示 平衡 策略 。” 红 黑 树 经 常用 于 实现 映 
射 ， 它 能 有 效 地 对 映射 进行 大 量 编辑 ， 且 由 于 目 平衡 的 绿 故 ， 可 以 迅速 
在 映射 中 查找 任何 给 定 的 键 。 


AVL 树 征 另 一 种 目 平 衡 砚 。 与 红 起 树 相 比 ，AVL 树 的 插入 与 删除 操作 
较 慢 ， 但 平衡 性 往往 更 好 ， 这 意味 痢 AVL Wirtz La 




















(D 自 平衡 策略 不 在 本 书 的 讨论 范围 之 内 ， 感 兴趣 的 读者 可 以 在 网 上 搜索 相关 视频 。 
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快 。 当 需要 频 葵 进行 读 操 作 上 时， 通常 利用 AVL 树 来 优化 性 能 。 


数据 通 第 存储 在 磁盘 中 ， 磁 盘 能 读 取 大 数据 块 。 这 种 情况 下 可 以 使 用 B 
树 ， 它 是 二 又 树 的 泛 化。B 树 中 的 结 皮 能 存储 一 个 以 上 的 元 素 ， 也 可 以 
包括 两 个 以 上 的 子 结 点 ， 从 而 提高 对 大 数据 块 的 操作 效率 。B 树 通 并 用 
于 实现 数据 库 系统 ， 后 面 的 革 廊 将 对 此 进行 讨论 。 





4.3.7 SIE 


二 叉 扒 是 一 种 特殊 类 型 的 二 又 查找 树 ， 可 以 立即 检索 到 最 大 (或 最 小 ) 
元 素 。 这 种 数据 结构 在 实现 优先 队列 时 尤其 有 用 。 在 查找 最 大 (或 最 
小 ) 元 素 时 ， 由 于 最 大 (或 最 小 ) 元 素 始终 是 树 的 根 结 点 ， 堆 的 时 间 复 
杂 度 为 OU);， 在 搜索 或 插入 结 点 时 ， 堆 的 时 间 复 杂 度 仍然 为 O(log n). 
堆 与 二 又 查找 树 的 结 点 布局 规则 相同 ， 但 父 结 点 必须 大 于 (或 小 于 ) 它 
的 两 个 子 结 点 。 








图 4-9 最 大 堆 (上 ) 与 最 小 堆 (下) 的 结 点 布局 
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如 和 朱 必 须 频 楷 对 集合 中 的 最 大 (或 最 小 ) 元 素 进 行 操作 ， 使 用 二 又 堆 走 
=A o 


4.3.8 


图 与 树 类 似 ， 区 别 在 于 图 没有 子 结 扩 或 父 结 护 ， 因 此 也 没有 根 结 皮 。 图 
由 结 点 和 边 构 成 ， 且 任何 结 点 可 以 有 多 个 人 边 或 出 边 。 

图 是 取 灵 活 的 数据 结构 ， 几 乎 可 以 表示 所 有 类 型 的 数据 。 例 如 ， 图 非 第 
适合 描述 社交 网 络 ， 其 中 结 点 代表 人 ， 边 代表 人 与 人 之 间 的 友谊 。 








4.3.9 BOIR 


散 列 表 查 找 元 素 的 时 间 复 杂 度 为 O(1)。 无 论 是 搜索 1000 万 个 元 素 还 是 
10 个 元 素 ， 所 需 的 时 间 都 是 一 个 稼 量 。 


与 数组 类 似 ， 需 要 预先 为 散 列 表 分 配 大 块 连 续 的 存储 空间 以 存储 数据 ， 
所 不 同 的 是 ， 获 列表 中 的 元 素 并 非 存 储 在 有 序 序列 中 。 元 素 所 占 的 位 置 
由 “神奇 的 ” 散 列 函数 确定 。 这 走 一 种 特殊 的 国 数 ， 它 将 准备 存储 的 数 
据 作 为 输入 ， 并 和 输出 一 个 随机 生成 的 数字 ， 作 为 存储 元 素 的 位 置 。 


艇 列表 可 以 实现 对 元 素 的 即时 检索 。 散 列国 数 首先 计算 给 定 的 值 ， 然 后 
输出 元 素 在 内 存 中 的 确切 地 址 ， 通 过 该 地 址 就 能 检索 到 存储 的 元 素 。 


散 列 表 的 问题 在 于 ， 对 于 两 个 不 同 的 输入 ， 散 列 函 数 有 时 会 返回 相同 的 
存储 地 址 ， 导 致 散 列 冲突 。 冲 突 发 生 时 ， 两 个 元 素 必 须 保存 在 相同 的 
存储 地 址 (例如 ， 使 用 从 给 定 地 址 开始 的 链表 )。 散 列 冲 突 带 来 额外 的 
CPU 与 内 存 开销 ， 应 尽量 避免 。 


对 于 不 同 的 输入 ， 一 个 合适 的 散 列 函数 应 返回 随机 生成 的 值 。 因 此 ， 艇 
列 函 数 输出 的 值 范 围 越 大 ， 可 用 的 数据 位 置 就 越 多 ， 发 生 散 列 冲 突 的 
可 能 性 就 越 小 。 有 鉴于 此 ， 应 确保 散 列 表 中 存在 至 少 50% 的 可 用 空间 ， 
否则 过 于 频 党 的 冲突 将 显 闭 降低 散 列 表 的 性 能 。 


艇 列表 经 前 用 于 实现 映射 与 集合 。 与 基于 树 的 数据 结构 相 比 ， 散 列表 能 
以 更 快 的 速度 插入 与 删除 元 素 ， 但 需要 大 量 连 续 内 存 才 能 正常 工作 。 

















4.4 小 结 


这 一 章 介绍 了 数据 结构 在 计算 机 内 存 中 组 织 数 据 的 具体 方法 。 针 对 不 同 
的 数据 结构 ， 需 要 使 用 不 同 的 操作 来 存储 、 删 除 、 搜 索 并 运行 保存 的 数 
据 。 不 存在 一 种 放 之 四 海 而 皆 准 的 数据 结构 ， 应 根据 实际 情况 选择 采用 
哪 种 数据 结构 。 


本 革 讲 解 了 与 其 直接 在 代码 中 使 用 数据 结构 ， 不 如 使 用 抽象 数据 类 型 。 
我 们 可 以 借 此 将 代码 与 数据 操作 细 市 相互 分 离 ， 并 轻松 切换 程序 的 数据 
结构 而 无 须 修改 任何 代码 。 


除非 是 出 于 上 自 娱 、 学 习 或 研究 目的 ， 人 否则 不 要 从 零 开始 创建 基本 的 数据 
结构 与 抽象 数据 类 型 ,“ 重 新 发 明 轮子 ”"” 并 非 明智 之 举 。 应 使 用 已 经 过 
民 好 测试 的 第 三 方 数 据 处 理 库 。 大 部 分 语言 都 提供 对 这 些 数 据 结构 的 内 
Ss, 
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O 在 软件 开发 领域 ,“ 轮 子 ” 指 已 经 存在 并 可 以 直接 使 用 的 解决 方案 。“ 重 新 发 明 轮 子 ” 
意 为 在 已 有 现成 解决 方案 的 情况 下 ， 仍 然 要 上 自行 开发 解决 方案 ， 这 有 时 是 一 种 无 
用 功 。 但 在 茶 些 情况 下 ,， 造 轮子 ”也 可 能 是 不 得 已 而 为 之 ， 比 如 因为 版 权 原 因 无 
法 使 用 现 有 的 代码 ， 或 现 有 的 “轮子 ”无 法 满足 需要 。 一 一 译 者 注 











第 口音 


算 法 


(编程 ) 之 所 以 吸引 人 ， 不 仅 因为 它 能 带 来 经 济 与 科学 上 的 回 
报 ， 也 因为 它 是 一 种 类 似 于 创作 诗歌 或 音乐 的 审美 体验 。 


人 类 致力 于 解决 日 益 困 难 的 问题 。 大 多 数 问题 都 有 人 进行 过 类 似 的 研 
究 ， 所 以 可 以 洽 虑 利用 前 人 发 现 的 高 效 算法 。 在 求解 问题 之 前 ， 首 要 工 
作 始 终 是 寻找 现 有 的 算法 。” 这 一 章 将 讨论 一 些 著 名 的 算法 ， 包 括 : 


3 高 效 排序 超 长 列表 

P 快速 搜索 所 需 的 元 素 

过 操作 与 处 理 图 

S 利用 第 二 次 世界 大 战 期 间 发 展 起 来 的 运筹 学 来 优化 过 程 


这 一 章 将 讨论 可 以 应 用 这 些 已 知 方案 解决 的 问题 ， 包 括 数据 排序 、 模 式 
搜索 、 寻 路 等 许多 不 同 的 类 型 。 不 少 算法 针对 特定 的 研究 领域 ， 如 图 像 
处 理 、 密 码 学 、 人 工 智 能 等 。 受 篇 幅 所 限 ， 本 书 无 法 洱 盖 所 有 内 容 ，” 
只 介绍 一 些 最 重要 的 算法 ， 每 位 优秀 的 程序 员 都 应 该 对 它们 了 然 于 心 。 














5.1 排序 


在 计算 机 出 现 之 前 ， 数 据 排序 古 一 个 主要 瓶 贷 ， 需 要 耗费 大 量 时 间 和 手动 
进行 。19 世纪 90 年 代 ， 制 表 机 公司 (IBM 的 前 身 ) 实现 了 排序 操作 的 
目 动 化 ， 从 而 使 美国 人 口 普查 数据 的 编 莫 工作 提前 儿 年 完成 。 





D 很 难 找到 一 个 前 人 从 未 探索 过 的 新 问题 。 研 究 人 员 发 现 某 个 新 问题 时 ， 会 就 此 择 
写 一 篇 科学 论文 。 
@ 维基 百科 提供 了 完整 的 算法 列表 。 
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排序 算法 的 数量 很 多 。 简 单 排序 算法 的 时 间 复 杂 度 为 On, 2.1 节 讨 论 
的 选择 排序 束 是 这 样 一 种 算法 ， 人 们 往往 用 它 来 排序 扑 殉 牌 。 选 择 排 序 
是 一 种 具有 二 次 成 本 的 算法 ， 这 类 算法 通 稼 用 于 对 1000 ARANKA 
小 数据 集 进 行 排序 。 一 种 著名 的 二 次 排序 算法 是 插入 排序 ， 它 在 排序 几 
平 已 排序 的 数据 集 时 非常 有 效 〈 即 便 数据 集 很 大 )。 
function insertion_sort(list) 
for 1 e < = list. length 
Zoe Jj and list[j-1] > list[j] 
list.swap_items(j, j-1) 
ee 
请 读者 在 纸 上 写 下 上 述 算法 ， 并 使 用 一 个 几乎 已 排序 的 数字 列表 来 运行 
程序 。 如 东 输 入 元 素 的 数量 很 少 ， 则 insertion_sort 算法 的 时 间 复 
REH O(n)。 这 种 情况 下 ， 该 算法 执行 的 操作 比 其 他 任何 排序 算法 都 
要 少 。 


观察 表 3-2 可 以 看 到 ， 对 于 没有 排序 的 大 数据 集 ， 时 间 复 杂 度 为 On) 的 
算法 耗 时 过 多 ， 因 此 我 们 需要 寻找 更 加 高 效 的 算法 。 最 知名 的 高 效 排序 算 
法 是 归并 排序 (3.6 市 ) 与 快速 排序 ， 二 者 的 时 间 复 杂 度 均 为 OU log ui. 
利用 快速 排序 对 一 堆 扑 殉 牌 进行 排序 的 步骤 如 下 。 


(1) 如 果 牌 的 数量 少 于 4 张 ， 按 正确 的 顺序 排 好 即 可 ， 否 则 继续 执行 第 2 步 。 

C) 从 这 堆 牌 中 随机 选择 一 张 作 为 基准 。 

(3) 将 大 于 基准 的 牌 置 于 基准 右 侧 的 牌 堆 ， 小 于 基准 的 牌 置 于 基准 左 全 
的 牌 堆 。 

(4) 分 别 对 左右 两 侧 的 牌 堆 重复 上 述 过 程 。 

(5) 将 完成 排序 的 左 侧 牌 堆 、 基 准 、 右 侧 牌 堆 合并 在 一 起 ， 就 会 得 到 一 
个 已 排序 的 牌 堆 。 

请 读者 洗 出 一 副 牌 ， 并 根据 上 述 步骤 理 牌 。 这 是 学 习 快速 排序 的 好 方 

法 ， 也 有 助 于 加 深 对 递归 的 理解 。 

掌握 上 述 算法 有 助 于 处 理 大 部 分 涉及 排序 的 问题 。 我 们 无 法 逐一 介绍 所 

有 排序 算法 ， 请 记 住 ， 排 序 算法 的 数量 很 多 ， 每 种 算法 适用 于 求解 特定 

的 排序 问题 。 
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5-1 快速 排序 示例 


5.2 搜索 


在 内 存 中 碍 找 特 定 信息 是 计算 中 的 一 项 重要 操作 ， 因 此 扎实 的 搜索 算法 
知识 必 不 可 少 。 了 最 简单 的 搜索 算法 征 顺 序 搜索 ， 它 逐一 碍 找 所 有 元 素 ， 
直至 找到 指定 元 素 ， 或 在 完成 所 有 元 素 的 检索 后 确定 指定 元 系 不 存在 。 


不 难看 出 ， 顺 序 搜索 的 时 间 复 杂 度 为 On), HE n 是 搜索 空间 的 元 素 
总 数 。 但 如 琳 所 搜索 的 元 素 结 构 民 好 ， 就 能 采用 更 有 效 的 方式 进行 搜 
索 。 根 据 4.3 廊 的 讨论 可 知 ， 在 搜索 平衡 二 又 查找 树 中 的 数据 时 ， 其 时 
间 复 杂 度 仅 为 O(log oh, 
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如 采 元 素 位 于 排序 数组 中 ， 也 可 以 通过 二 分 查找 进行 搜索 ， 这 种 算法 的 
时 间 复 杂 度 同样 为 O(log n)。 二 分 查找 在 每 一 步 使 搜索 空间 缩小 一 半 。 
function binary_search(items, key): 
if not items 
return NULL 
1 e items. length / 2 
if key = items[i] 
return items[i] 
if key > items[i] 
sliced e items.slice(i+1, items.length) 
else 
sliced ¢ items.slice(0, 1-1) 
return binary_search(sliced, key) 


如 上 所 示 ，binary_search 算法 在 每 一 步 执 行 固定 数量 的 操作 ， 并 使 
输入 范围 缩小 一 半 。 换 言 之 ， 对 于 个 元 素 ， 只 需 log, n 步 就 能 完成 对 
全 部 输入 的 检索 。 由 于 每 一 步 执 行 的 操作 数量 固定 不 变 ， 该 算法 的 时 间 
复杂 度 为 O(log n)。 无 论 是 搜索 100 万 还 是 1 万 亿 个 元 素 ， 都 能 保持 较 
快 的 搜索 速度 。 


然而 还 存在 更 高 效 的 方法 : 如 来 将 元 素 存 储 在 散 列表 (4.3 市 ) 中 ， 那 
么 只 需 计 算 所 搜索 的 键 的 散 列 值 ， 因 为 它 给 出 了 上 共有 该 键 的 元 素 的 地 
址 。 搜 索 空 间 增 加 时 ， 碍 找 一 个 元 素 所 需 的 时 间 不 会 因此 而 增加 ， 搜 索 
数 百 万 、 数 十 亿 划 至 数 万 化 个 元 素 均 契 如 此 。 由 于 操作 数量 固定 不 变 ， 
算法 的 时 间 复 杂 度 为 O(1)， 搜 索 儿 乎 可 以 瞬时 完成 。 














5.9 


第 4 草 曾 经 介绍 过 ， 图 是 一 种 灵活 的 数据 结构 ， 它 使 用 结 点 与 边 存储 信 
息 ， 在 社交 网 络 ( 结 点 代表 人 ， 边 代表 朋友 关系 )、 电 话 网 络 ( 结 点 代 
表 电 话 与 电话 局 ， 边 代表 通信 ) 等 领域 得 到 了 广泛 应 用 。 


5.3.1 图 的 搜索 


怎样 在 图 中 查找 某 个 结 点 呢 ” 如 来 无 法 从 图 的 结构 中 获得 线索 ， 就 必须 
访问 图 中 的 所 有 绪 点 ， 直 至 找到 指定 结 点 。 为 此 可 以 采用 两 种 方法 : R 
度 优先 搜索 与 三 度 优先 搜索 。 
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图 5-2 采用 深度 优先 搜索 ( 左 ) 与 广度 优先 搜索 A) HETE 


深度 优先 搜索 (DFS) 沿 着 图 的 边 逐 渐 深 入 ， 当 到 达 某 个 与 任何 新 结 点 
都 没有 边 相 连 的 结 点 时 ， 就 返回 前 一 个 结 上 扣 并 继续 上 述 过 程 。 栈 用 于 跟 
踪 搜 索 路 径 : 探索 到 结 点 时 将 其 压 入 栈 中 ， 并 在 需要 返回 时 从 栈 中 弹出 
Eo 3.4 市 讨论 的 回溯 策略 就 是 利用 这 种 方式 实现 搜索 。 


function DFS(start_node, key) 
next_nodes e Stack.new() 
seen_nodes ¢ Set.new() 


next_nodes.push(start_node) 
seen_nodes.add(start_node) 


while not next_nodes.empty 
node ¢ next_nodes.pop() 
if node.key = key: 
return node 
for n in node.connected_nodes 
if not n in seen_nodes 
next_nodes.push(n) 
seen_nodes.add(n) 
return NULL 


如 果 无 法 发 起 深度 优先 搜索 ， 也 可 以 尝试 使 用 广度 优先 搜索 (BFS). 

它 逐 层 对 图 进行 探索 ， 从 起 始 结 点 的 相 邻 结 点 开始 ， 然 后 是 相 邻 结 点 的 

相 邻 结 操 ， 以 此 类 推 。 队 列 用 于 跟 中 访问 鸭 结 皮 。 完 成 某 个 结 扣 的 探索 

后 ， 我 们 将 它 的 子 结 扩 插入 队列 ， 然 后 取出 下 一 个 结 反 进行 探索 。 
function BFS(start_node, key) 


next_nodes ¢ Queue.new() 
seen_nodes ¢ Set.new() 


next_nodes.enqueue(start_node) 
seen_nodes.add(start_node) 


while not next_nodes.empty 


node < next_nodes.dequeue() 
if node.key = key: 
return node 
for n in node.connected_nodes 
if not n in seen_nodes 
next_nodes.enqueue (n) 
seen_nodes.add(n) 
return NULL 


请 注意 ，DFS 与 BFS 仅 在 下 一 个 待 探索 结 点 的 存储 方式 上 有 上 所 不 同 : 
DFS 使 用 栈 ， 而 BFS 使 用 队列 。 


那么 应 该 使 用 哪 种 搜索 方法 呢 ? DFS 更 容易 实现 ， 消 耗 的 内 存 也 更 少 ， 
因为 只 需 存 储 指 问 当 前 结 点 的 父 结 点 。 与 之 相反 ，BFS 需要 存储 搜索 过 
程 的 整个 边界 。 如 果 图 包含 数 百 万 个 结 点 ，BFS 或 许 并 不 可 行 。 


如 来 正在 搜索 的 结 皮 可 能 距离 起 始 结 点 不 还 ， 那 么 选择 成 本 较 高 的 DES 
较为 划算 ， 因 为 BFS 有 助 于 更 快 地 找到 指定 结 点 。 如 采 需 要 探索 图 的 
全 部 结 点 ， 则 最 好 坚持 使 用 DFS， 因 为 它 易 于 实现 且 内 存 占用 更 少 。 

















Aati | 人 
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gon Eë 
我 该 准备 哪些 情况 呢 ? DA AEA DAA tk? oe 
AE B) & bi? 性 个 Än A 
C) 从 桂子 上 挥 丰 示 c) FAK? A A 


2) 此 条 
3) T FT RE 





我 来 接 你 。 根据 半数 致死 量 (LDo), 
你 还 波 换 好 ok äs 


ERD? FRAKT! 


我 确实 需要 停止 使 用 
深度 优 先 ,搜索 o 


5-3 “深度 优先 搜索 ”( 取 自 http:/xkcd.com ) 
从 图 5-3 中 可 以 看 到 ， 选 择 错 误 的 探索 方法 会 产生 严重 后 果 。 
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53.2 REE 


可 以 将 图 着 色 问 题 描 述 如 下 : 给 定 固定 数量 的 “颜色 ”( 或 其 他 任何 一 
组 标签 )， 必 须 为 图 中 的 每 个 结 点 分 配 一 种 颜色 ， 且 通过 边 相 连 的 结 点 
不 能 共享 同一 种 颜色 。 举 例如 下 。 


手机 干扰 较 ”给 定 一 张 基站 及 其 服务 小 区 的 地 图 ， 位 于 相 邻 小 
区 的 基站 必须 工作 在 不 同 的 频率 以 避免 干扰 ， 且 有 4 种 频率 可 
供 选 择 。 那 么 应 该 为 每 个 基站 分 配 哪 种 频率 ? 


首先 使 用 图 为 上 述 问题 建 模 : 图 中 的 结 点 表示 基站 ， 两 个 基站 距离 过 近 
会 相互 干扰 ， 通 过 边 将 二 者 相连 ， 每 种 颜色 代表 一 种 频率 。 


如 何 得 到 可 行 的 频率 分 配方 案 呢 ?是 人 否 能 找到 一 种 仅 使 用 3 种 甚至 2 种 
闫 色 的 解决 方案 ?实际 上 ， 寻 找 有 效 颜 色 分 配 所 需 的 最 少 颜色 数量 古 一 
种 NP 完全 问题 ， 只 能 采用 指数 算法 求解 。 


我 们 不 准备 给 出 上 述 问 题 的 算法 ， 请 运用 所 学 的 知识 尝试 自己 解决 这 个 
问题 。 读 者 可 以 通过 在 线 评 测 系 统 UVA 提交 自己 的 解 。UVA 将 运行 用 
户 的 代码 并 测试 有 效 性 ， 如 果 代 码 有 效 ， 系 统 还 将 比较 不 同 用 户 的 代码 
执行 时 间 。 书 籍 只 能 传授 理论 知识 ， 请 读者 着 手 研 究 解决 这 个 问题 的 算 
法 与 策略 并 进行 尝试 。 同 UVA 这 样 的 在 线 评测 系统 提交 代码 ， 有 助 于 
获得 成 为 优秀 程序 员 所 需 的 实践 经 验 。 








53.3 Sta 


寻找 结 点 之 间 的 最 短路 径 是 最 兰 名 的 图 问题 。GPS 导航 系统 通过 搜索 街 
道 与 十 字 路 口 的 图 来 计算 行程 ， 茶 些 系统 其 至 利用 交通 数据 来 增加 表示 
拥堵 街道 的 边 的 权重 。 


虽然 可 以 采用 BFS 与 DFS 策略 找 出 较 短 的 路 径 ， 但 二 者 并 非 最 佳 方 案 。 
寻找 最 短路 径 的 一 种 著名 方法 是 戴 克 斯 特 拉 算 法 ， 它 是 一 种 非常 有 效 的 
算法 。BFS 使 用 辅助 队列 来 跟踪 探索 的 结 点 ， 而 戴 克 斯 特 拉 算 法 使 用 优 
先 队 列 。 完 成 新 结 点 的 探索 后 ， 结 点 之 间 的 连接 被 添加 到 优先 队列 。 结 
点 的 优先 级 是 连接 该 结 点 与 起 始 结 点 的 边 的 权重 。 因 此 ， 下 一 个 探索 的 
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结 反 总 征 距 离开 始 位 置 最 近 的 结 反 。 


茶 些 情况 下 ， 戴 克 斯 特 拉 算 法 将 陷入 无 限 人 循环 ， 永 十 无 法 找到 目标 结 
太 。 负 循环 会 请 使 搜索 过 程 无 休止 地 进行 ， 它 表示 图 中 在 同一 结 点 开始 
与 结束 的 路 径 ， 路 径 中 边 的 总 权重 为 负 值 。 有 鉴于 此 ， 在 边 可 能 为 负 权 
重 的 图 中 搜索 最 短路 径 时 务 请 小 心 。 


如 采 准 备 搜索 的 图 过 于 庞大 ， 又 该 如 何 处 理 呢 ? 可 以 芬 虑 使 用 双向 搜索 
以 提高 搜索 速度 。 两 个 搜索 进程 分 别 从 起 始 结 点 与 目标 结 点 同时 运行 ， 
如 来 一 个 搜索 区 域 中 的 任意 结 把 也 出 现在 男 一 个 搜索 区 域 ， 说 明 找 到 了 
符合 条 件 的 路 径 。 单 向 搜索 的 搜索 区 域 是 双 癌 搜索 的 两 倍 。 观 察 图 5-4 
可 以 看 到 ， 灰 色 区 域 的 面积 小 于 黄色 区 域 。 图 5-5 所 示 为 一 个 算法 示例 。 








图 5-4 单间 搜索 区 域 与 双 癌 搜索 区 域 的 对 比 
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5.3.4 PageRank 


REEMA, Google AA HTA LKA H RA wi E 
MHAPA? 这 个 过 程 涉 及 多 种 算法 ， 其 中 了 最 重要 的 是 PageRank 算法 。 


在 创建 Google 之 前 ， 谢 尔 盖 : 布 林 与 拉 里 : 佩 奇 是 斯 坦 福 大 学 的 计算 机 
科学 学 者 ， 致 力 于 图 算法 的 研究 。 两 人 将 万 维 网 建 模 为 一 张 图 ， 其 中 结 
氮 表 示 网 页 ， 边 表示 网 页 之 间 的 链接 。 


布 林 与 佩 柯 认为 ， 如 采 一 个 网 页 包括 许多 来 自 其 他 重要 页 面 的 链接 ， 那 
么 该 网 页 必然 也 很 重要 。 两 人 根据 这 个 想法 开发 了 按 轮 执行 的 PageRank 
算法 。 在 初始 阶段 ， 图 中 的 所 有 网 页 具有 相同 的 “分 值 ”; 每 轮 计算 完 
成 后 ， 每 个 页 面 将 各 自 的 分 值 分 发 给 与 之 链接 的 页 面 。 上 述 过 程 重复 进 
行 ， 直 至 所 有 分 值 达 到 稳定 分 布 。 每 个 页 面 的 稳定 分 值 称 为 PageRank。 
Google 使 用 PageRank 算法 确定 网 页 的 重要 性 ， 迅 速 占 据 了 搜索 引擎 市 
场 的 主导 地 位 。 

PageRank 算法 也 可 应 用 于 其 他 类 型 的 图 。 例 如 ， 我 们 可 以 利用 图 对 
Twitter 用 户 进行 建 模 ， 然 后 计算 每 个 用 户 的 PageRank, MWA, BHAR 
高 PageRank 的 用 户 是 否 可 能 是 一 位 重要 人 物 呢 ? 
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第 二 次 世界 大 战 期 间 ， 闫 国 陆 军需 要 做 出 最 佳 的 战略 决策 以 便 优 化 作战 
效果 。 为 寻求 协调 军事 行动 的 最 佳 方法 ， 军 方 开 发 了 多 种 分 析 工 具 。 


这 种 实践 被 命名 为 运筹 洱 ， 这 门 学 科 改 进 了 美国 早期 的 预警 雷达 系统 ， 
并 帮助 政府 更 好 地 管理 人 力 与 和 资源。 战争 期 间 ， 数 百 位 英国 科学 家 致力 
于 运筹 学 的 研究 ， 二 战 结束 后 ， 新 的 理念 在 优化 企业 与 行业 的 流程 中 得 
到 了 应 用 。 运 筹 学 涉 及 定义 最 大 化 或 最 小 化 的 目标 ， 它 有 助 于 在 最 大 程 
度 上 提高 收益 、 利 润 或 顷 效 ， 并 尽 可 能 降低 损失 、 风 险 或 成 本 。 


例如 ， 航 衬 公 司 利 用 运 寿 学 来 优化 航班 时 刻 表 ， 对 安 动 力 与 设备 调度 进 
行 微 调 能 节省 数 百 万 美元 的 开 文 ， 此外， 炼油 三 需要 在 混合 原料 中 找 出 








最 佳 配 比 ， 这 也 可 以 被 视 为 一 个 运 寿 学 问题 。 


5.4.1 线性 最 优化 问题 


如 果 可 以 利用 线性 方程 对 问题 的 目标 与 约束 条 件 进行 建 模 ， 则 称 其 为 
线性 最 优化 问题 。 本 节 将 讨论 如 何 求解 这 类 问题 。 


文件 柜 采 购 图 ”办公室 需要 采购 文件 柜 。 文 件 柜 义 的 价格 为 
10 美元 ， 占 地 6 平方 英尺 ， 能 存放 8 立方 英尺 的 文件 ; 文件 
柜 立 的 价格 为 20 美元 ， 占 地 8 平方 英尺 ， 能 存放 12 立方 英 
尺 的 文件 。 如 果 预 算 为 140 美元 ， 且 办 公 室 有 72 平方 英尺 的 
空间 可 以 放置 文件 柜 ， 那 么 如 何 采 购 才 能 存放 最 多 的 文件 ? 


首先 确定 问题 中 的 变量 。 采 用 x 与 y 表示 两 种 文件 柜 的 购置 数量 。 


O x: 文件 柜 X 的 购置 数量 。 
O y: 文件 柜 Y 的 购置 数量 。 


我 们 希望 存储 容量 最 大 化 。 设 存储 容量 为 <z， 将 其 作为 x 与 y 的 函数 进 
ITER, P: 
z= 8x + 12y 


然后 选择 x 与 y 的 值 ， 以 便 使 z 最 大 。x 与 y 的 值 必须 满足 预算 和 面积 
的 约束 条 件 ， 即 140 美元 以 内 和 不 超过 72 平方 英尺 。 根 据 这 些 约束 条 
件 进行 建 模 。 

O 10x+20y < 140 (预算 约束 ) 

O 6x+8y <72 (面积 约束 ) 

D x 三 0, y>0 (无 法 购买 负数 个 文件 柜 ) 


那么 如 何 求解 上 述 问题 呢 ? 由 于 办 公 室 放置 文件 柜 的 空间 有 限 ， 不 能 简单 
地 购买 具有 了 最 佳 存 储 容 量 与 占 地 面积 之 比 的 文件 柜 。 或 许可 以 利用 弯 力 法 
编写 一 个 程序 ， 对 所 有 可 能 的 x 与 y 计 算 z， 并 选择 能 使 z 最 大 的 x 与 
的 组 合 。 但 蛮 力 法 只 适合 求解 简单 的 问题 ， 如 朱 变 量 较 多 则 不 太 可 行 。 














O 形式 上 指 一 次 多 项 式 。 线 性 方程 可 以 没有 平方 (dl, ， 甚 变量 只 能 与 常数 相 乘 。 
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事实 证 明 ， 求 解 这 样 的 线性 最 优化 问题 不 必 编 写 程 序 ， 只 需 使 用 合适 的 
工具 即 可 。 单 纯 形 法 可 以 有 效 求解 线性 最 优化 问题 ， 目 20 世纪 60 年 代 
以 来 一 直 是 解决 复杂 问题 的 利 合 。 如 采 读 者 必须 求解 茶 个 线性 最 优化 问 
题 ， 不 要 “重新 发 明 轮 子 ， 选 择 一 种 现成 的 单纯 形 法 求解 准 即 可 。 

在 单纯 形 法 求解 副 中 输入 需要 最 大 化 〈 或 最 小 化 ) 的 函数 以 及 对 约束 条 
件 建 模 的 方程 ， 其 余 工 作 将 由 求解 细 完 成 。 在 本 例 中 ,使 z 最 大 的 x 与 
y 的 组 合 为 x=8 且 y=3。 

单纯 形 法 对 可 能 解 的 空间 进行 巧妙 的 探索 。 为 理解 这 种 算法 的 原理 ， 我 
们 采用 二 维 平面 表示 与 y》 所 有 可 能 的 值 ， 其 中 直线 表示 预算 与 面积 的 
约束 条 件 (参见 图 5-6). 


Y 

符合 面积 限制 条 件 的 选择 
一 

符合 两 种 限制 条 件 的 选择 
7 


e 


12 14 x 
图 5-6 ”满足 问题 约束 条 件 的 x 与 y 值 


请 注意 ， 所 有 可 能 解 的 空间 古 图 中 的 封闭 区 域 。 现 已 证 明 ， 线 性 问题 的 最 
优 解 必须 古 这 个 封闭 区 域 的 蘑 个 角 点 ， 它 是 各 个 约束 条 件 的 交 又 把 。 单 纯 
形 法 检查 这 些 角 点 ， 从 中 选 出 使 z 节 优 的 角 点 。 在 多 于 两 个 变量 的 线性 最 
优化 问题 中 ， 很 难 通过 示意 图 表示 上 述 过 程 ， 但 数学 原理 并 无 不 同 。 








54.2 网络 流 问题 


许多 与 网 络 和 流 有 关 的 问题 都 能 用 线性 方程 表示 ， 从 而 很 容易 利用 单纯 
形 法 求解 。 


补给 网 络 晒 ”连接 各 个 城市 的 铁路 线 构成 了 铁路 网 。 每 条 铁路 
线 具 有 最 大 运力 ， 即 每 日 可 运送 的 最 大 物资 流量 。 那 么 从 一 个 
给 定 的 生产 城市 可 以 运送 多 少 物资 到 一 个 给 定 的 消费 城市 ? 


采用 线性 方程 对 上 述 问 题 建 模 ， 每 条 铁路 线 以 一 个 变量 表示 ， 它 是 通过 
该 铁路 线 运 送 的 物资 量 。 约 束 条 件 如 下 : 所 有 铁路 线 不 能 超过 其 运力 ， 
除 生产 与 消费 城市 外 ， 所 有 城市 的 物资 流入 量 必须 与 物资 流出 量 相等。 
接 下 来 需要 选择 变量 的 值 ， 以 便 使 接收 城市 的 物资 流入 量 最 大 化 。 


此 处 不 准备 详细 解释 线性 形式 的 映射 。 本 节 的 重点 在 于 告诉 读者 ， 许 多 
涉及 图 、 成 本 与 流 的 最 优化 问题 很 容易 通过 现 有 的 单纯 形 法 实现 求解 。 
读者 可 以 从 网 上 找到 大 量 有 用 的 文档 ， 并 请 留意 ， 不 要 浪费 时 间 “ 重 新 
发 明 轮子 ”。 








5.5 小 结 


这 一 草 介 绍 了 求解 各 类 问题 所 用 的 一 些 知名 算法 与 技术 。 在 解决 问题 之 
前 ， 首 先 应 寻找 现 有 的 算法 与 方法 。 


受 坊 幅 所 限 ， 许 多 重要 的 算法 疝 未 包括 在 内 ， 例 如 ， 比 戴 殉 斯 特 拉 算 法 
更 高 级 的 搜索 算法 (如 A 星 算法 ) 、 检 测 两 个 单词 相似 程度 的 算法 (E 
文 斯 坦 跑 离 )、 机 和 硕 学 习 算 法 等 ， 不 一 而 足 。 
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第 6 章 


数据 库 


尽管 我 因为 在 数据 库 方面 的 贡献 而 为 人 所 熟知 ， 但 架构 师 的 工 
作 才 是 我 所 擅长 的 : 分析 需 求 并 构建 简单 但 优雅 的 解决 方案 。 
一 一 查尔斯 巴赫 曼 


管理 计算 机 系统 中 的 和 诲 量 数据 集合 并 非 易 事 ， 但 往往 至 关 重 要 : 生物 学 
家 存储 并 检索 DNA 序列 及 其 相关 的 蛋白质 结构 :Facebook 管理 由 数 十 
亿 用 户 生成 的 内 容 ;: Amazon 跟踪 其 销售 、 库 存 与 物流 信息 。 


如 何在 磁盘 上 存储 这 些 不 断 变 化 的 海 量 数 据 集 合 ? 不 同 代 理 如 何 同时 检 
R. JARIR? 我 们 通过 数据 库 管 理 系统 (DBMS) 实现 这 些 功 
能 ， 它 征用 于 管理 数据 库 的 一 种 特殊 软件 。DBMS 负责 数据 的 组 织 与 存 
储 ， 并 协调 对 数据 库 的 访问 与 修改 。 这 一 草 将 讨论 以 下 内 容 : 


是 理解 大 部 分 数据 库 使 用 的 关系 模型 

《9 灵活 使 用 非 关 系数 据 库 系统 

a 协调 计算 机 并 分 发 数据 

O 利用 地 理 数 据 库 系统 更 好 地 绘制 地 

D 通过 数据 序列 化 实现 跨 系统 的 数据 共享 


虽然 天 系数 据 库 系统 占据 主导 地 位 ， 但 非 关 系数 据 库 系 统 通 党 易于 实现 
是 效率 更 高 。 数 据 库 系统 种 类 苏 多 ， 选 择 满足 需要 的 数据 库 并 非 多 事 。 
这 一 革 将 概述 不 同类 型 的 数据 库 系 统 。 


为 有 效 利 用 数据 ， 首 先 要 能 方便 地 通过 数据 库 系 统 访问 数据 。 矿 工 可 以 
从 看 似 廉价 的 岩石 地 块 中 开采 出 价值 连城 的 矿物 与 金属 ， 我 们 同样 可 以 


O 查尔斯 .巴赫 曼 (1924 一 2017)， 美 国 计 算 机 科学 家 ， 数 据 库 技术 先驱 ， 曾 设计 并 
开发 了 第 一 代 网 状 数据 库 系统 一 一 集成 数据 存储 (IDS)，1973 年 因 “ 数 据 库 技术 
方面 的 杰出 贡献 ”而 获得 图 灵 奖 。 巴 赫 曼 在 标准 制定 方面 也 颇 有 建树 ， 是 开放 系 
统 互 连 (OSI) 标准 的 制定 者 之 一 。 译 者 注 
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从 数据 库 中 提取 出 有 用 的 信息 。 这 就 古 所 谓 的 数据 挖掘 。 


例如 ， 一 家 大 型 连锁 杂货 店 分 析 产 品 交 易 数 据 后 发 现 ， 那 些 消 费 最 多 的 
顾客 会 经 常 购买 一 种 日 销量 不 足 200 份 的 奶 酷 。 一 般 情 况 下 ， 连 锁 店 会 
停止 供应 销量 较 低 的 产品 。 但 经 理 因为 数据 挖 据 受 到 局 发 ， 不 仅 没 有 让 
这 种 奶 酷 产 品 下 架 ， 还 将 它 置 于 更 显眼 的 位 置 。 这 一 举措 座 受 消费 最 多 
的 顾客 好 评 ， 他 们 光顾 连 锯 店 的 次 数 也 随 之 增加 。 这 家 连锁 杂货 店 之 所 
以 能 做 出 如 此 明智 的 决定 ， 得 益 于 数据 库 系 统 中 组 织 民 好 的 数据 。 





6.1 关系 数据 库 


20 世纪 60 年 代 末 出 现 的 关系 模型 是 信息 管理 领域 的 一 个 巨大 飞跃 。 关 
系数 据 库 可 以 很 容易 地 避免 信息 重复 与 数据 不 一 至 ， 它 是 目前 使 用 最 广 
这 的 数据 库 系 统 。 


在 关系 模型 中 ， 数 据 被 划分 为 不 同 的 表 ， 其 工作 方式 类 似 于 第 阵 或 电子 表 
格 。 表 中 的 行 代表 数据 条 目 ， 列 征 数 据 条 目 具 有 的 不 同属 性 。 通 闻 会 为 列 
日 定 可 以 容纳 的 数据 类 型 ， 也 可 以 指定 其 他 限制 条 件 ， 如 征 否 要 求 行 必须 
在 该 列 中 具有 值 ， 或 列 中 的 值 必须 在 表 的 所 有 行 中 唯一 ， 不 一 而 足 。 


通 间 将 列 称 为 字段 。 如 采 列 仅 能 存储 整数 ， 则 称 其 为 整数 字段 。 不 同 的 
表 使 用 不 同类 型 的 字段 ， 表 的 组 织 由 字段 以 及 针对 字段 的 限制 决定 。 字 
段 与 限制 的 这 种 组 合 称 为 表 的 模式 。 

所 有 数据 条 目 都 是 行 ， 如 琳 行 违反 表 的 模式 就 无 法 进入 数据 库 系 统 ， 这 
古 关 系 模 型 的 一 大 局 限 。 当 数据 特征 变化 过 大 时 ， 将 数据 拟 合 为 菜 种 固 
定 的 模式 可 能 很 麻烦 。 但 如 果 所 处 理 的 数据 具有 同 质 结构 ， 那 么 固定 模 
式 有 助 于 确保 数据 果 有 效 性 。 


6.1.1 关系 


设想 一 个 包含 在 单 张 表 中 的 发 票数 据 库 ， 每 张 发 票 必 须 保存 订单 与 客户 
才 息 。 如 果 需 要 为 同一 个 客户 存储 多 张 发 票 ， 信 息 将 出 现 重复 。 











EK 


cen 
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2017-02-18 Elaine Roberts 101-9973 $77.57 
2017-02-20 Bobby Tables 997-1009 $99.73 
2017-02-22 Bobby Tables 991-1009 $12.01 


图 6-1 存储 在 单 张 表 中 的 发 票数 据 


重复 的 信息 很 难 管理 与 更 新 ， 为 解决 这 个 问题 ， 关 系 模型 将 相关 信息 分 
解 到 不 同 的 表 中 。 例 如 ， 我 们 将 发 票数 据 分 为 “订单 ”与 “客户 ”两 张 
表 ， 并 使 “订单 ” 表 中 的 每 一 行 引 用 “客户 ” 表 中 的 某 一 行 。 


客户 
op e Je 
Ea 


2017-02-17 Bobby Tables 997-1009 $93.37 









订单 





nl Dm 
DES ` Er 


6-2 行 之 间 的 关系 可 以 避免 数据 重复 


通过 将 不 同 表 中 的 数据 关联 起 来 ， 同 一 个 客户 可 以 出 现在 许多 订单 中 而 
\ 会 造成 数据 重复 。 为 支持 关系 的 使 用 ， 每 张 表 都 有 一 个 特殊 的 标识 字 
段 (或 ID)， 它 用 于 引用 表 中 特定 的 行 。ID 值 必须 唯一 ， 即 两 行 不 能 共 
享 同一 个 DD。 表 的 有 D 字段 也 称 为 主键 ， 记 录 对 其 他 行 ID 的 引用 的 字 
段 称 为 外 键 。 


值 由 主键 与 外 键 ， 就 能 在 不 同 的 数据 集 之 间 创 建 复杂 的 关系 。 例 如 ， 
6-3 所 示 的 表 用 于 存储 图 灵 奖 ”得 主 的 相关 信息 。 


37 Bobby Tables | 997-1009 












O 图 灵 奖 被 誉 为 “计算 机 科学 领域 的 诺 贝尔 奖 ”"， 奖 金 为 100 万 美元 。 
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图 6-3 计算 机 科学 家 与 图 灵 奖 


“计算 机 科学 家 ”与 “奖项 ” 表 之 间 的 关系 不 像 “客户 ”与 “i 订单 ” 表 
那样 筒 单 。 两 位 计算 机 科学 家 可 以 共享 一 个 奖项 ， 一 位 计算 机 科学 家 也 
可 以 多 次 歼 奖 。 有 鉴于 此 ， 我 们 采用 “图 灵 奖 得 主 ” 表 存储 计算 机 科学 
家 与 奖项 之 间 的 关系 。 

如 村 一 个 数据 库 以 完全 不 存在 重复 信息 的 方式 进行 组 织 ， 则 称 该 数据 库 
是 规范 化 的 。 将 包含 重复 数据 的 数据 库 转 换 为 不 包含 重复 数据 的 过 程 称 
为 规范 化 。 
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6.1.2 ”模式 迁移 


随 着 应 用 程序 的 规模 增长 以 及 新 功能 越 来 越 多 ， 其 数据 库 结构 (所 有 表 
的 模式 ) 很 难保 持 不 变 。 如 有 需要 调整 数据 库 结 构 ， 我 们 可 以 创建 一 个 
模式 迁移 脚本 ,以 便 目 动 升 级 模式 并 相应 地 转换 现 有 数据 。 这 些 脚 本 通 
前 还 具备 撤销 更 改 的 功能 ， 从 而 很 容 多 就 能 恢复 数据 库 结 构 ， 使 之 匹配 
先前 杀 个 软件 版 本 。 


大 部 分 DBMS 都 提供 现成 的 模式 迁移 工具 ， 可 以 帮助 用 户 创建 、 应 用 
与 恢复 模式 迁移 脚本 。 茶 些 大 型 系统 每 年 要 进行 数 百 次 模式 迁移 ， 因 此 
这 些 工具 是 必 不 可 少 的 。 如 末 不 创建 模式 迁移， 那么 对 数据 库 的 “ 手 
动 ” 更 改 将 很 难 恢复 到 指定 的 工作 版 本 ， 难 以 保证 不 同 软件 开发 人 员 有 的 
本 地 数据 库 之 间 相 互 兼 容 。 这 些 问 题 在 不 太 注 重 数据 库 实践 的 大 型 软件 
项 目 中 经 常 出 现 。 


6.1.3 SQL 


几乎 所 有 关系 DBMS 都 使 用 一 种 名 为 SQL 的 查询 语言 。 受 篇 幅 所 限 ， 
本 书 不 准备 深入 讨论 SQL， 仅 对 其 工作 原理 做 一 概述 。 即 便 不 直接 己 
SQL HRE, ARIMA WAS BREZ, SQL ëm HA, E 
TR T e eta A NJAE o 

SELECT <field name> [, <field name>, <field name>,..] 

FROM <table name> 

WHERE <condition>,} 
SELECT 后 跟 表 示 硕 望 获取 的 字段 ， SELECT * ”用 于 获取 表 中 的 所 有 他 
段 。 由 于 数据 库 中 可 能 存在 多 个 表 ， 使 用 FROM 来 声明 需要 查询 哪个 表 。 
WHERE 命令 指定 了 所 选 行 的 条 件 ， 可 以 通过 布尔 逻辑 指定 多 个 条 件 。 以 
下 面 的 查询 为 例 ， 我 们 从 “客户 ” 表 中 获取 所 有 字段 ， 并 根据 “姓名 ” 
与 “年龄 ”字段 对 行 过 着 。 


SELECT * FROM customers 
WHERE age > 21 AND name = "John"; 
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读者 可 以 在 不 指定 WHERE 子 句 的 情况 下 执行 “SELECT * FROM customers” 
查询 ， 此 时 将 返回 所 有 客户 。 其 他 需要 黎 握 的 查询 操作 符 包括 ORDER BY 
与 GROUP BY; 前 者 根据 指定 字段 对 结果 排序 ， 后 者 用 于 将 结果 分 组 并 
返回 每 个 组 的 聚合 结果 。 假 设 “ 客 户 ” 表 包含 “国家 ”与 “年 龄 ” 字 
段 ， 那 么 可 以 进行 以 下 查询。 

SELECT country, AVG(age) 

FROM customers 

GROUP BY country 

ORDER BY country; 
上 述 查 询 将 返回 一 个 客户 居住 国家 的 排序 列表 ， 以 及 每 个 国家 的 客户 平 
均 年 龄 。 也 可 以 使 用 SQL 提供 的 其 他 聚合 函数 。 例 如 ， 采 用 MAX (age) 
标 换 AvG(age) ， 则 查询 将 返回 每 个 国家 最 年 长 客户 的 年 龄 。 


东 些 情况 下 ， 我 们 需要 考 碟 行 中 的 信息 以 及 与 信息 关联 的 其 他 行 。 仍 然 
以 之 前 讨论 的 “订单 ” 表 与 “客户 ” 表 为 例 ， 二 者 分 别 存储 订单 与 客 
户 的 信息 。 如 图 6-2 所 示 ,， “订单 ” 表 包 括 一 个 引用 “客户 ” 表 的 外 键 。 
如 末 希 望 查 找 创建 高 价值 订单 的 客户 信息 ， 就 需要 从 两 个 表 中 获取 数 
据 。 但 我 们 不 必 单 独 查 询 两 个 表 并 目 行 匹 配 记 录 ， 采 用 以 下 SQL 命令 
BHH, 

SELECT DISTINCT customers.name, customers .phone 

FROM customers 


JOIN orders ON orders.customer = customers.id 
WHERE orders.amount > 100.00; 


上 述 查 询 将 返回 订单 超过 100 美元 的 客户 的 姓名 与 电话 号 码 。SELECT 
DISTINCT 限定 每 个 客户 只 需 返 回 一 次 。]JOINY 可 以 实现 非常 灵活 的 查 
询 ， 但 也 要 付出 一 定 代 价 : JOIN 操作 的 计算 成 本 很 高 ， 因 为 该 操作 会 
考虑 查询 中 所 连接 的 表 中 每 一 行 的 组 合 。 数 据 库 管 理 右 必须 时 刻 广 意 连 
接 表 行 数 的 乘积 。 如 果 表 的 规模 特别 大 ，JOIN 操作 将 无 法 实现 。JOIN 
是 关系 数据 库 中 最 有 力 的 操作 ， 但 同时 也 是 最 湾 弱 的 环 市 之 一 。 








© 执行 JOIN 操作 的 方式 很 多 ， 详 见 http://www.sql-join.com/。 
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6.1.4 So 


要 使 表 的 主键 发 挥 作用 ， 必 须 在 给 定 ID 值 时 能 迅速 检索 数据 条 目 。 为 
IE, DBMS 构建 了 一 个 辅助 索引 ， 用 于 将 行 D 映射 到 它们 在 内 存 中 的 
相应 地 址 。 从 本 质 上 说 ， 索 引 古 一 种 自 平衡 二 又 查找 树 (4.3 市 )， 表 中 
的 每 一 行 对 应 于 树 中 的 一 个 结 扩 





ID 的 索引 


| e pem 
| 
- -12- UK 





UK 
> o4 | Dennis Ritchie | 1941-09-09 


图 6-4 将 了 D 值 映射 到 行 的 位 置 的 索 5| 


结 点 键 是 索引 字段 中 的 值 。 我 们 搜索 树 中 的 值 ， 以 查找 具有 给 定 值 的 窜 
存 姓 。 找 到 结 点 后 取出 它 存储 的 地 址 ， 根 据 地 址 就 能 获取 寄存 顷 。 搜 索 
ONERA RREA O(log n), KEEKEKE IE ar HR 
度 很 快 。 


通 第 情况 下 ，DBMS 为 数据 库 中 的 每 个 主键 邦 建 立 一 个 索引 。 如 末 经 党 
需要 通过 搜索 其 他 字段 来 查找 寄存 如 (如 根据 姓名 搜索 客户 )， 可 以 指 
示 DBMS 为 这 些 字 段 建立 额外 的 过 5|。 


了 唯一 性 约束 ”具有 唯一 性 约束 的 字段 通 闸 会 日 动 建 并 索 5|。 当 插入 新 的 
行 时 ，DBMS 必须 对 整个 表 进 行 搜索 以 确保 没有 违反 唯一 性 约束 。 在 没 
有 索引 的 字段 中 查找 条 个 值 时 ， 需 要 检查 表 中 的 所 有 行 ， 而 对 于 建 并 索 
引 | 的 字段 ， 我 们 很 快 就 能 找到 准备 插入 的 值 是 否 已 经 存在 。 为 具有 唯一 
性 约束 的 字段 建 并 索引， 对 实现 元 素 的 快速 插入 至 关 重 要 。 


排序 ”在 建立 索引 的 字段 中 ， 索 引 有 助 于 以 排序 顺序 获取 行 。 例 如 ， 如 
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果 “ 姓 名 ”字段 包括 索引 ， 那 么 无 须 额 外 的 计算 就 能 按 姓名 对 行 排序 。 
而 在 没有 索引 的 字段 中 使 用 ORDER BY 时 ，DBMS 必须 在 处 理 查询 请 求 
前 先 对 内 存 中 的 数据 排序 。 当 查询 涉及 的 行 数 过 多 时 ， 对 于 那些 请 求 按 
非 索 引 字段 排序 的 查询 ， 不 少 DBMS 甚至 可 能 拒绝 执行 。 


如 果 必 须 先 按 国 家 、 再 按 年 龄 对 行 排 序 ， 那 么 为 “年 龄 ”或 “国家 ”了 字 
段 建立 索引 并 无 太 大 帮助 。 虽 人 然 为 “国家 ”字段 建立 索引 后 可 以 获取 按 
国家 排序 的 行 ， 但 仍然 需要 按 年 龄 对 同一 国家 的 客户 手动 排序 。 当 需要 
对 两 个 字段 排序 时 ， 可 以 使 用 联合 索引 。 它 对 多 个 字段 建立 索 3|， 虽 然 
无 法 加 快 元 素 查 找 的 速度 ， 但 可 以 使 返回 数据 在 多 个 字段 中 的 排序 变 得 
DURE. 


性 能 ”索引 的 功能 强大 ， 可 以 实现 极 快 的 查询 以 及 对 排序 数据 的 即时 访 
问 。 那 么 ， 为 何不 为 每 张 表 的 所 有 字段 都 建立 索 ?| 呢 ? 这 起 因为 在 表 中 
插入 或 删除 一 个 寄存 右 时 ， 必 须 更 新 表 的 全 部 索引 以 反映 这 种 变化 。 如 
朱 索 引 的 数量 很 多 ， 更 新 、 揪 入 或 删除 行 的 计算 开销 可 能 会 变 得 很 大 
(不 要 忘记 树 的 平衡 )。 此 外 ， 索 引 会 占用 磁盘 空间 ， 而 这 并 非 无 限 的 
资源 。 


读者 应 广 意 监控 应 用 程序 使 用 数据 库 的 情况 ，DBMS 通 第 会 提供 相应 的 
工具 。 这 些 工 具 可 以 “解释 EW, Kréi "fc, LL 
及 执行 查询 时 需要 对 多 少 行进 行 顺序 扫描 。 如 采 碍 询 消 耗 太 多 时 间 对 一 
个 字段 中 的 数据 进行 顺序 扫 摘 ， 应 考虑 为 该 字段 建立 乏 引 ， 观 察 征 个 有 
所 帮助 。 例 如 ， 如 末 需 要 频 葵 查询 一 个 给 定年 龄 人 口 的 数据 库 ， 那 么 为 
年龄 ”字段 建立 索引 后 ，DBMS 就 能 直接 选择 与 给 定年 龄 对 应 的 行 。 
由 于 不 必 通 过 顺序 扫 朱 来 过 着 不 匹配 给 定年 龄 的 行 ， 碍 询 时 间 得 以 
减少 。 


要 调整 数据 库 以 获得 更 高 的 性 能 ， 关 和 键 在 于 了 解 需要 保留 与 需要 丢弃 的 
索 5|。 如 琳 数 据 库 主 要 进行 读 取 但 很 少 更 新 ， 那 么 保留 更 多 的 索引 或 许 
较为 明智 。 精 糕 的 索引 是 导致 商业 系统 速度 降低 的 主要 原因 。 粗 心 的 系 
统管 理 员 通 弟 不 去 检查 常用 查询 的 运行 情况 ， 他 们 只 为 目 己 “ 感 觉 ” 会 
提高 性 能 的 随机 字段 建立 索引 一 一 但 这 并 非 恨 策 。 请 使 用 “解释 ”工具 
来 检查 奋 询 ， 并 仪 在 索 ?1 有 助 于 改善 性 能 时 再 添加 索引 |。 
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6.1.5 ”事务 


想象 一 家 神秘 的 瑞士 银行 没有 任何 转账 记录 ， 银 行 的 数据 库 仅 存储 账户 
余额 。 假 设 有 人 和 希望 将 资金 从 自己 的 账户 转移 到 朋友 在 同一 家 银行 开设 
的 账户 ， 那 么 银行 的 数据 库 必 须 执行 两 项 操作 : 从 一 个 账户 扣除 金额 ， 
并 问 另 一 个 账户 添加 金额 。 


数据 库 服 务 器 通常 允许 多 个 客户 同时 读 写 数据 ， 因 为 采用 顺序 方式 执 
行 操 作 会 导致 DBMS 的 速度 过 慢 。 问 题 在 于 ， 如 果 有 人 在 扣除 金额 之 
后 、 添 加 金额 之 前 查询 所 有 账户 的 总 余额 ， 就 会 发 现 资金 丢失 。 更 糟糕 
的 是 ， 如 果 系 统 在 两 项 操作 之 间断 电 会 发 生 什么 情况 ? 当 系 统 恢 复 连接 
后 ， 很 难 找 出 数据 不 一 致 的 原因 。 


因此 ， 数 据 库 系 统 要 么 执行 某 项 多 部 分 操作 的 所 有 更 改 ， 要 么 保持 数据 
不 变 。 为 此 ， 数 据 库 系统 提供 了 一 种 称 为 事务 的 功能 ， 它 是 必须 以 原子 
HR O 执行 的 数据 库 操作 的 列表 。 事 务 有 助 于 简化 程序 员 的 工作 : 数据 
库 系 统 负责 保持 数据 库 的 一 致 性 ， 程 序 员 只 需 将 相关 操作 包 闭 在 一 起 
HI ol. 
START TRANSACTION; 
UPDATE vault SET balance 
UPDATE vault SET balance 
COMMIT; 
请 记 住 ， 在 没有 事务 的 情况 下 执行 多 步 更 新 ， 最 终 会 导 怪 数据 出 现 无 法 
控制 、 难 以 预料 且 不 易 发 现 的 不 一 致 问题 。 








balance + 50 WHERE 1d=2; 
balance - 50 WHERE id=1; 


6.2 非 关 系数 据 库 


关系 数据 库 功 能 强大 ， 但 也 存在 一 定 的 局 限 性 。 随 着 应 用 程序 越 来 越 复 
浅 ， 其 关系 数据 库 将 包括 越 来 越 多 的 表 。 查 询 变 得 越 来 越 大 ， 越 来 越 难 
以 理解 。 此 外 ，JOIN 操作 逐 部 增多 ， 不 仅 会 增加 计算 成 本 ， 还 可 能 造 
成 严重 的 瓶颈 。 





O 原子 操作 在 一 步 内 执行 完毕 ， 不 会 出 现 执行 一 半 的 情况 。 
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非 关 系 模型 抛弃 了 表格 关系 ， 它 几乎 不 需 ;要 合并 来 日 多 个 数据 条 目的 信息 。 
由 于 非 关 系数 据 库 系统 使 用 不 同 于 SQL 的 查询 语言 ， 也 被 称 为 NoSQL 
数据 库 。 


如 何 撰写 简历 


HI 
E 
Q 
a 
oi 
x 
Z 
D 





利用 NoSQL 的 热潮 


6-5 “NoSQL” (WÄ http://geek-and-poke.com/) 


6.2.1 文档 存储 


| NoSQL 数据 库 类 型 是 文档 存储 。 在 文档 存储 中 ， 数 据 
全 按 应 用 程序 需要 的 方式 保存 。 以 存储 博客 文章 为 例 ， 图 6-6 比 
a 


评论 








图 6-6 采用 关系 模型 (上 ) 与 非 关 系 模型 (下 ) 存储 数据 
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注意 观察 一 篇 文 草 的 所 有 数据 如 何 被 复制 到 该 文 草 的 寄存 絮 中 。 非 天 系 
模型 期 望 用 户 在 每 个 相关 位 置 执行 信息 的 复制 ， 这 种 模型 很 难保 持 重复 
数据 的 更 新 与 一 致 。 但 通过 将 相关 数据 分 组 ， 文 档 存 储 可 以 提供 更 大 的 
灵活 性 ， 包 括 : 


口 无 须 对 行 执 行 连接 操作 ， 
口 无 须 固定 模式 .，; 
口 可 以 为 每 个 数据 条 目 分 别 配置 字段 。 


换言之 ， 文 档 存储 中 不 存在 “ 表 ” 与 “ 行 。 相 反 ， 数 据 条 目 称 为 文档 ， 
相关 文档 被 分 组 在 集合 


文档 包括 一 个 主键 字段 ， 因 此 可 以 跋 文档 创建 天 系 。 但 JOIN 操作 在 文 
档 存 储 中 并 非 最 佳 选择 ， 有 时 其 至 无 法 实现 ， 所 以 用 户 必 须 自行 跟踪 文 
档 之 间 的 关系 。 两 种 方法 都 很 糟糕 : 如 采 多 个 文档 共享 相关 数据 ， 那 么 
应 该 将 数据 复制 到 文档 中 。 


与 关系 数据 库 一 样 ，NoSQL 数据 库 同样 为 主键 字段 建立 索引 。 此 外 ， 
也 可 以 为 需要 经 第 查询 或 排序 的 字段 添加 额外 的 索引 1。 


6.2.2” 键 值 对 存储 


在 有 组 织 且 持 久 的 数据 存储 方式 中 ， 键 值 对 存储 是 最 简单 的 形式 ， 主 要 
在 缓存 中 使 用 。 例 如 ， 用 户 向 服务 器 请 求 特 定 网 页 时 ， 服 务 颖 必须 从 数 
据 库 获取 网 页 的 数据 ， 并 使 用 这 些 数据 演 染 准备 发 送 给 用 户 的 HTML., 
对 需要 处 理 数 千 次 并 发 访问 的 高 流量 网 站 而 言 ， 这 种 操作 并 不 可 行 。 


为 解决 这 个 问题 ， 我 们 使 用 键 值 对 存储 作为 缓存 机 制 。 其 中 键 是 所 请 求 
的 URL， 值 是 相应 网 页 的 最 终 HTML。 用 户 下 一 次 请 求 相同 的 URL 时 ， 
只 需 使 用 URL 作为 键 ， 从 键 值 对 存储 中 检索 已 生成 的 HTML 即 可 。 


如 采 需 要 重复 未 种 总 是 产生 相同 结 采 且 速 度 很 慢 的 操作 ， 应 芳 虑 将 其 
缓存 。 但 刍 值 对 存储 并 非 唯 一 选择 ， 也 可 以 将 缓存 保存 在 其 他 类 型 的 
数据 库 中 。 仅 当 需 要 频 允 访问 缓存 时 ， 才 能 体现 出 键 值 对 存储 系统 的 高 
AE 
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6.2.3 图 数据 库 


图 数据 库 将 数据 条 目 存 储 为 结 点 ， 关 系 存 储 为 忆 。 结 点 不 依赖 于 固定 的 
模式 ， 可 以 灵活 地 存储 数据 。 图 结构 能 根据 数据 条 目 之 间 的 关系 有 效 地 
处 理 数据 条 目 。 图 6-6 的 信息 在 图 中 的 表示 如 图 6-7 所 示 。 








图 6-7 使 用 图 数据 库存 储 博客 信息 


图 数据 库 古 最 灵活 的 数据 库 类 型 ， 它 抛弃 了 表 与 集合 ， 以 直观 的 方式 存 
储 网 络 化 数据 。 如 霖 希望 在 白板 上 绘制 城市 的 地 铁 与 公交 车 站 ， 不 必 编 
写 表 格 数 据 ， 使 用 循环 、 边 框 与 前 头 即 可 。 图 数据 库 支 持 采 用 这 种 方式 
存储 数据 。 


如 有 数据 的 结构 类 似 于 茶 种 网 络 ， 可 以 考虑 使 用 图 数据 库 。 当 数据 之 间 
存在 大 量 重 要 的 关系 时 ， 这 种 数据 库 尤 其 有 用 。 图 数据 库 还 能 实现 不 同 
类 型 的 面 回 图 的 查询 。 例 如 ， 将 公共 交通 数据 存储 在 图 中 ， 就 能 直接 碍 
询 两 个 给 定 公交 车 站 之 间 的 最 佳 直达 路 线 。 
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6.2.4 ”大 数据 


流行 词汇 大 数据 描述 了 在 容量 、 速 度 或 多 样 性 2 方面 极 具 挑 战 性 的 数据 
处 理 情况 。 大 的 数据 容量 表示 需要 处 理 数 拍 字 节 (PB) 的 数据 ， 相 当 
于 大 型 强 子 对 撞 机 ”产生 的 数据 量 。 高 的 数据 速度 表示 每 秒 能 存储 百 万 
次 写 操作 而 没有 延迟 ， 或 快速 处 理 数 十 亿 次 读 查 询 。 数 据 多 样 性 表示 数 
据 没 有 很 强 的 结构 ， 因 此 难以 使 用 传统 的 关系 数据 库 进 行 处 理 。 


任何 情况 下 ， 如 果 由 于 容量 、 速 度 或 多 样 性 而 需要 采用 非 标准 的 数据 管 
理 方法 ， 都 可 以 将 其 称 作 “大 数据 ”应 用 。 为 开展 某 些 最 先进 的 科学 实 
验 (如 与 大 型 强 子 对 撞 机 或 平方 千 米 阵 ”有关 的 实验 ) , 计算 机 科学 家 正 
在 致力 于 他 们 称 之 为 大 数据 (megadata) 的 研究 ， 对 数 百 万 太 字 节 的 数 
据 进行 存储 和 分 析 。 


由 于 增加 了 灵活 性 方面 的 要 求 ， 大 数据 通 第 与 非 关系 数据 库 相 关 ， 许 多 
类 型 的 大 数据 应 用 无 法 通过 关系 数据 库 实现 。 














6.2.5 SQL 与 NoSQL 的 比较 


关系 数据 库 以 数据 为 中 心 ， 无 论 数 据 的 需求 如 何 ， 都 能 最 大 限度 利用 数 
据 结构 并 消除 重复 。 非 关系 数据 库 以 应 用 程序 为 中 心 ， 便 于 根据 用 户 需 
求 进行 访问 和 使 用 。 

根据 之 前 的 讨论 可 知 ，NoSQL 数据 库 能 快速 有 效 地 存储 大 量 匈 失 性 的 
非 结 构 化 数据 。 用 户 不 必 担 心 固定 模式 与 模式 迁移 ， 可 以 更 快 地 开发 解 
决 方案 。 对 程序 员 来 说， 非 天 系数 据 库 通 笛 感 觉 更 目 然 、 更 容易 。 


韭 关系 数据 库 功 能 强大 ， 但 用 户 需 要 人 负 贡 更 新 跨 文 档 与 集合 的 重复 信息 ， 
并 采取 必要 措施 保持 数据 的 一 致 性 。 请 记 住 ， 权 力 越 大 ， 责 任 也 越 大 。 





D 通常 称 为 3V (volume, velocity, variety) 。 有 时 也 称 为 SV, 另 外 两 个 V 是 价值 (value) 
与 准确 性 (veracity). 

© 大 型 强 子 对 撞 机 (LHC) 是 全 球 最 大 的 粒子 加 速 器 。 在 一 次 实验 中 ， 其 传感器 每 
秒 产生 的 数据 量 为 1000 KET. 

© 平方 千 米 阵 (SKA) 是 一 组 计划 于 2020 年 投入 使 用 的 望远镜 ， 每 天 将 产生 100 万 
太 字 证 的 数据 。 
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6.3 “分布 式 数据 库 


某 些 情 况 下 ， 多 人 台 (而 非 一 台 ) 计算 机 必须 协同 工作 才能 提供 数据 库 系 
统 。 举 例如 下 。 


D 数 百 太 字 节 的 数据 库 。 没 有 一 台 计算 机 的 存储 空间 能 如 此 之 大 。 

o 每 秒 处 理 数 千 次 并 发 查询 的 数据 库 系统 。” 没 有 一 台 计 算 机 拥有 足够 
的 网 络 或 处 理 能 力 以 应 付 这 种 规模 的 负载 。 

D 任务 关键 型 数据 库 ， 如 记录 特定 空域 内 飞机 当前 高 度 与 速度 的 数据 
库 。 依 靠 一 台 计算 机 过 于 冒险 ， 一 旦 这 台 计算 机 出 溃 ， 数 据 库 将 无 
法 使 用 。 

在 上 述 场景 中 ，DBMS 运行 在 多 台 协 同 工 作 的 计算 机 中 ， 构 成 一 个 分 布 

式 数据 库 系统 。 接 下 来 ， 我 们 将 讨论 建立 分 布 式 数据 库 时 最 常用 的 一 些 

方法 。 








6.3.1 单 主 机 复制 


一 台 计 算 机 作为 主机 ， 人 负 贡 接收 所 有 对 数据 库 的 查询 。 主 机 与 多 台 从 机 
相连 ， 每 台 从 机 都 有 一 份 数据 库 的 副本 。 主 机 收 到 写 查 询 后 转发 给 从 
机 ， 使 各 个 从 机 保持 同步 。 
P aan a 从 机 #1 
查 SC = 
SS RO 人 机 4#2 


£, | 
A Sat | 
E i #3 


图 6-8 单 主机 分 布 式 数据 库 





© 2014 年 世界 杯 决 赛 结 束 之 后 ，Twitter 在 峰值 时 的 新 推 文 数量 超过 每 秒 1 万 条 。( 作 
为 对 比 ， 阿 里 巴巴 自主 研制 的 X-DB 分 布 式 数据 库 在 2017 年 “ 双 十 一 ”期 间 首 次 
亮相 ， 支 撑 的 零点 峰值 为 32.5 万 笔 / 秒 。 一 一 译 者 注 ) 
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在 上 述 设置 中 ， 主 机 将 读 碍 询 委托 给 各 个 从 机 ， 因 此 可 以 处 理 更 多 的 读 
查询 。 系 统 的 可 靠 性 也 随 之 提高 ， 如 来 主 机 出 现 故 障 ， 从 机 可 以 目 动 协 
调 并 选举 一 个 新 的 主机 ， 从 而 确保 系统 能 持续 运行 。 


6.3.2 ”多 主机 复制 


如 打数 据 库 系统 必须 支持 大 量 并 发 写 碍 询 ， 那 么 一 台 主 机 无 法 处 理 所 有 
负载。 这 种 情况 下 ， 集 群 中 的 所 有 计算 机 都 成 为 主机 ， 人 负载 均衡 副将 传 
入 的 读 写 查 询 平 均 分 配给 集群 中 的 计算 机 。 


geg 
读 查询 
a 和 
二 | 负载 均衡 器 KE 
» L N 
A 写 查询 yx ar 
` TEE 


图 6-9 多 主机 分 布 式 数据 库 
如 上 所 示 ， 每 台 计 算 机 与 集群 中 所 有 其 他 计算 机 相连 。 写 查询 在 计算 机 
之 间 传 播 ， 使 得 所 有 计算 机 均 保持 同步 。 换 言 之 ， 每 台 计 算 机 邦 有 一 份 
完整 数据 库 的 副本 。 





6.3.3 pb 


如 末 数 据 库 收 到 许多 针对 大 量 数据 的 写 查 询 ， 那 么 使 集群 中 的 所 有 计算 
机 保持 数据 库 同 步 并 非 多 事 ， 因 为 未 些 计 算 机 可 能 疫 有 足够 的 存储 空间 
保存 整个 数据 库 。 一 种 解决 方案 是 将 数据 库 切 分 到 各 个 计算 机 中 。 由 于 
每 台 计 算 机 都 拥有 数据 库 的 一 部 分 ， 查 询 路 由 如 会 将 查询 转发 给 相应 的 
计算 机 。 


106 | 第 6 划 数据 库 


读 查 询 : ID "PRW6L" 性 


读 查 询 : ID "TOQZR" 月 


D 


"Se, ID "BTZLK" 








查询 路 由 器 





FF 一 一 一 一 一 一 一 ! 一 一 一 一 距 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 司 - 一 ' 一 一 一 一 一 一 一 一 一 一 ae 一 一 一 一 一 一 一 一 一 一 一 一 


1 | | | l 
y a a Ba 
1 SAH Spe l BEH | BAH 
A 一 F l G—L | M—R S=Z i 


和 


6-10 分 斤 设 置 示 例 : 根据 所 查询 的 ID 的 第 一 个 字母 对 查询 进行 路 由 


上 述 设置 有 能 力 处 理 针 对 超大 数据 库 的 大 量 读 写 查 询 ， 但 它 存在 一 个 问 
题 ， 如 琳 集 群 中 的 一 台 计 算 机 出 现 故 障 ， 这 台 计 算 机 保存 的 那 部 分 数据 
将 无 法 使 用 。 为 降低 这 种 风险 ， 可 以 将 分 厂 与 复制 结合 在 一 起 使 用 。 





j E AF "Te = o 4 S SC 
RI D wm 
主机 有 | 主机 加 e | ans | amn T 
Ki | ES | Fei | EN 
1 | | | | 
从 机 1.1 | 从 机 2.1 | 从 机 3.1 | 从 机 4.1 
EE EE SE ss 1 
| E | Ei | GG | E i 
1 | | | | 
8 从 机 1.2 | 从 机 2.2 | 从 机 3.2 | 从 机 4.2 | 


和 


6-11 分 片 设置 示例 : 每 个 分 片 包括 3 个 副本 


如 上 所 示 ， 每 个 分 片 由 一 个 主 从 集群 提供 服务 ， 以 进一步 增强 数据 库 系 
统 处 理 读 查 询 的 能 力 。 如 琳 分 片 中 的 一 台 主 服务 絮 发 生 故 障 ， 从 服务 颖 
可 以 目 动 取代 它 ， 确 保 系 统 不 会 朋 闹 或 丢失 数据 。 
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6.3.4 数据 一 致 性 


在 使 用 复制 的 分 布 式 数据 库 中 ， 一 台 计 算 机 进行 的 更 新 无 法 立即 传播 给 
所 有 副本 。 集 群 中 的 所 有 计算 机 在 一 段 时 间 后 才能 达到 同步 状态 ， 这 会 
破坏 数据 一 致 性 。 


以 在 线 销 售 电影 票 为 例 。 由 于 流量 过 大 ， 网 站 的 数据 库 分 布 在 两 台 服 务 
大 中 。 艾 丽 斯 从 服务 如 A 购 灭 了 一 张 票 ， 而 鲍 勃 在 服务 背 B 上 也 发 现 
了 这 张 票 。 在 艾 丽 斯 的 购 票 信息 发 送 给 服务 絮 B 之 前 ， 鲍 勃 也 进行 了 购 
票 操作 ， 导 致 两 人 台 服 务 妖 出 现 数据 不 一 致 。 为 解决 这 个 问题 ， 我 们 不 得 
不 取消 其 中 一 个 人 的 购 标 操作， 并 辣 异 息 的 艾 丽 斯 或 鲍 过 致 鞭 。 

可 以 利用 数据 库 系 统 提 供 的 工具 来 缓解 数据 不 一 致 造成 的 困扰 。 例 如 ， 
某 些 数据 库 支持 用 户 发 出 在 整个 集群 中 强制 执行 数据 一 致 性 的 查询 ， 不 
过 这 会 降低 数据 库 系 统 的 性 能 。 此 外 ， 事 务 会 强制 协调 集群 中 的 所 有 计 
算 机 以 锁定 可 能 的 大 块 数 据 ， 导 致 分 布 式 数据 库 出 现 严 重 的 性 能 问题 。 


这 十 需要 在 一 致 性 与 性 能 之 间 做 出 的 权衡 。 如 采 数 据 库 查询 并 非 严 格 执 





行 数据 一 致 性 ， 则 认为 它们 追求 最 终 一 致 性 ， 即 保证 数据 在 一 段 时 间 后 
能 最 终 达 到 一 致 性 。 这 意味 着 可 能 无 法 应 用 茶 些 写 奋 询 ， 茶 些 读 碍 询 可 
能 


了 

会 返回 过 时 的 信息 。 

许多 情况 下 ， 使 用 最 终 一 致 性 不 会 产生 问题 。 例 如 ， 在 线 销售 的 某 件 产 
品 显 示 有 284 条 而 韭 285 条 用 户 评 论 ， 这 并 非 说 明 出 现 了 问题 ， 因 为 有 
一 条 评论 是 刚刚 发 布 的 。 


DA ”地 理 数据 库 


许多 数据 库 都 存储 地 理 信 息 ， 如 城市 的 位 置 或 定义 州 边界 的 多 边 形 。 交 
通 类 应 用 可 能 需要 绘制 道路 、 铁 路 与 车 站 之 间 的 连接 方式 。 关 国人 口 调 
查 局 需要 存储 数 千 个 人 口 普查 区 的 制图 形状 ， 以 及 从 每 个 普查 区 采集 的 
人 口 普查 数据 。 


在 这 些 数 据 库 中 ， 查 询 空 间 信 息 十 分 有 趣 。 例 如 ， 如 来 我 们 人 负 和 贡 紧 急 医 
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疗 服务 ， 那 么 显然 需要 一 个 存储 本 地 区 医院 位 置 的 数据 库 。 对 于 任意 给 
定 的 位 置 ， 数 据 库 系统 必须 能 快速 找到 最 近 的 医院 。 


这 些 应 用 推动 了 地 理 信 息 系统 (GIS) 的 发 展 。 为 处 理 地 理 数 据 ，GIS 
专门 定义 了 PointField, LineField, PolygonField 等 字段 ， 并 能 在 这 些 字 
段 中 执行 空间 查询 。 以 存储 订 流 与 城市 信息 的 GIS 数据 库 为 例 ， 我 们 可 
以 直接 进行 以 下 查询 :“ 列 出 距离 密西西比 河 10 英里 之 内 的 城市 ， 并 按 
人 口 数 量 排序 ”。 由 于 GIS 使 用 空间 索引 ， 通 过 空间 邻近 度 进行 搜索 效 


RIRE o 


这 些 系统 黄 至 支持 用 户 定 义 空 间 约束 条 件 。 以 存储 地 块 信息 的 表 为 例 ， 
可 以 规定 两 个 地 块 不 得 重合 占据 相同 的 土地 ， 从 而 极 大 减少 土地 登记 部 
门 的 工作 量 。 


许多 通用 的 DBMS 都 提供 GIS 扩展 。 只 要 涉及 地 理 数 据 的 处 理 ， 请 务 
必 使 用 提供 GIS 支持 的 数据 库 引 擎 ， 利 用 GIS 的 特性 进行 更 为 智能 化 
的 查询 。GIS 在 日 常生 活 中 得 到 了 广泛 应 用 ， 如 Google Maps 或 Waze” 
这 样 的 GPS 导航 系统 。 





6.5 EIMERT 


如 何 将 数据 存储 在 不 同 的 数据 库 系 统 中 ， 并 保持 数据 的 互 操 作 性 ? 例 
如 ， 读 者 可 能 希望 将 数据 备份 或 导出 至 其 他 系统 。 为 此 ， 必 须 对 数据 做 
序列 化 处 理 。 在 此 过 程 中 ， 数 据 根据 茶 种 编码 格式 进行 转换 ， 生 成 的 文 
件 可 以 被 任何 支持 该 编码 格式 的 系统 所 识别 。 接 下 来 ， 我 们 对 数据 序列 
化 中 和 闻 用 的 编码 格式 做 一 概述 。 


SQL 〈 结 构 化 查询 语言 ) 是 序列 化 关系 数据 库 时 最 常见 的 格式 。 我 们 编 
写 一 系列 SQL 命令 来 复制 数据 库 及 其 所 有 细 习 。 大 部 分 关系 数据 库 系 
统 邵 提供 “ 转 储 ” 与 “恢复 ”命令 ， 前 者 用 于 创建 数据 库 的 SQL 序列 
化 文件 ， 后 者 用 于 将 这 类 “ 转 储 文件 ”加 载 回 数据 库 系 统 。 





D 中文 名 “位 智 ”， 最 初 由 以 色 列 Waze Mobile 公司 开发 ， 该 公司 于 2013 年 被 Google 
收购 。Waze 曾 在 2013 年 世界 移动 通信 大 会 上 宁 获 最 佳 综合 应 用 奖 。 一 一 译 者 注 
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XML (可 扩展 标记 语言 ) 是 表示 结构 化 数据 的 另 一 种 方式 ， 但 不 依赖 
于 关系 模型 或 其 种 数据 库 系 统 实现 。XML 致力 于 实现 不 同 计算 系统 之 
间 的 互 操 作 性 ， 并 摘 述 数据 的 结构 与 复杂 性 。 不 过 某 些 人 认为 ， 开 发 
XML 的 学 者 没有 意识 到 XML 并 不 实用 。 


JSON (JavaScript 对 象 表示 法 ) 是 一 种 得 到 大 部 分 人 认可 的 序列 化 格 
式 。 对 程序 员 而 言 ， 它 能 很 直观 地 表示 关系 数据 或 非 关 系数 据 。JSON 
还 衍生 出 许多 其 他 格式 : BSON (二进制 JSON) 能 最 大 限度 提高 JSON 
的 数据 处 理 效率 ， 而 JSON-LD (关联 数据 的 JSON) 将 XML 结构 的 强 
大 功能 引入 JSON, 


CSV (逗号 分 隔 值 ) 堪 称 数据 交换 的 最 简单 形式 。 数 据 以 文本 形式 存 
储 ， 每 行 包含 一 个 数据 元 素 ， 元 素 属性 通过 喜 写 (或 其 他 不 在 数据 中 出 
现 的 字符 ) 隔 开 。CSV 有 助 于 实现 简单 数据 的 转 储 ， 但 不 适合 表示 复杂 
数据 。 











6.6 ”小结 


在 数据 库 中 构造 信息 对 于 有 效 利用 数据 至 关 重要 ， 这 一 半 对 此 做 了 详细 
论述 ， 并 介绍 了 构造 信息 的 不 同方 式 。 关 系 模型 将 数据 分 解 到 表 中 ， 并 
通过 关系 将 数据 链接 在 一 起 。 


大 部 分 程序 员 仅 了 解 关 系 模型 的 应 用 ， 但 也 应 稳 握 利用 非 关 系 模型 来 构 
造 数据 。 我 们 讨论 了 数据 一 致 性 ， 以 及 如 何 通过 事务 来 缓解 数据 不 一 至 
造成 的 困扰 ;分布 式 数据 库 对 数据 库 系 统 进行 扩展 ， 以 便 处 理 高 负载 。 
这 一 章 对 GIS 做 了 介绍 ， 并 讨论 了 如 何 利 用 GIS 提供 的 特性 处 理 地 理 
数据 。 此 外 ， 我 们 还 展示 了 在 不 同 应 用 程序 之 间 交 换 数据 的 第 用 方法 。 


最 后 需要 指出 的 征 ， 除 非 出 于 实 监 目的 ， 人 否则 请 选择 一 种 广汉 使 用 的 
DBMS， 以 提高 性 能 并 减少 出 错 的 概率 。 不 过 数据 库 系 统 的 选择 不 存 
在 一 种 放 之 四 海 而 丝 准 的 方法 ,没有 哪 种 DBMS 能 完美 地 适用 于 所 有 
情况 。 完 成 这 一 草 的 学 习 后 ， 读 者 应 理解 不 同类 型 的 DBMS 及 其 特性 ， 
以 便 根 据 实 际 情况 做 出 明智 选择 。 
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第 7 草 
计算 机 


任何 技术 ， 只 要 足够 高 深 ,都 无 法 与 魔法 区 分 开 玉 。 
亚 瑟 " 克 拉克 


为 解决 各 种 问题 ， 人 们 发 明了 不 计 其 数 的 机 人 笑 。 计 算 机 种 类 党 多 ， 从 上航 
入 火星 漫游 机 闫 人 的 计算 机 到 为 操纵 核 芍 艇 导航 系统 的 计算 机 ， 不 一 而 
NW. fm 1945 年 提出 第 一 种 计算 模型 ， 无 论 笔记 本 电脑 还 是 
电话 ， 儿 乎 所 有 计算 机 都 遵循 与 这 种 模型 相同 的 工作 原理 。 那 么 读者 了 
解 计算 机 是 如 何 工作 的 吗 ? 这 一 草 将 讨论 以 下 内 容 : 


m 理解 计算 机 体系 结构 的 基础 知识 
全 :选择 编译 器 将 代码 转换 为 计算 机 可 以 执行 的 指令 
Ir 根据 存储 器 层次 结构 提高 数据 的 存储 速度 


年 竞 ， 在 非 程 序 员 看 来 ， 编 程 要 像 魔 法 一 样 神奇 ， 我 们 程序 员 不 会 这 人 么 看 。 








7.1 体系 结构 


计算 机 是 一 种 根据 指令 操作 数据 的 机 器 ， 主 要 由 处 理 器 与 存储 器 两 部 分 
组 成 。 存 储 器 又 称 RAM2， 用 于 存储 指令 以 及 需要 操作 的 数据 。 处 理 器 
又 称 CPU ， 它 从 存储 器 获取 指令 与 数据 ， 并 执行 相应 的 计算 。 接 下 来 ， 
我 们 将 讨论 这 两 部 分 的 工作 原理 。 





O EË. 克拉克 (1917 一 2008) ， 英 国 科 幻 小 说 家 ， 与 艾 萨 克 * 阿 西 莫 夫 和 罗伯特 ， 
海 因 业 因 并 称 为 20 世纪 三 大 科幻 小 说 家 。 殉 拉克 著作 等 导 , 最 知名 的 作品 是 《2001 
太空 漫游 )， 他 在 科幻 小 说 中 做 出 的 许多 预测 目前 都 已 成 为 现实 。 一 一 译 者 注 

© 即 随 机 存 取 存储 器 。 

© 即 中央 处 理 器 。 
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7.1.1 存储 器 


存储 器 被 划分 为 许多 单元 ， 每 个 单元 存储 少量 数据 ， 通 过 一 个 数字 地 址 
加 以 标识 。 在 存储 器 中 读 取 或 写 入 数据 时 ， 每 次 对 一 个 单元 进行 操作 。 
为 读 写 特定 的 存储 单元 ， 必 须 找到 该 单元 的 数字 地 址 。 


由 于 存储 器 是 一 种 电气 元 件 ， 单 元 地 址 作为 二 进 制 数 2 E 
每 条 信号 线 传输 一 个 比特 ， 以 高 电压 表示 信号 “1] ” ， 低 电压 表示 信号 
如 图 7-1 所 示 。 





单元 地 址 # 





图 7-1 指示 RAM 对 单元 210 (11010010) 进行 操作 


对 于 某 个 给 定 的 单元 地 址 ， 存 储 器 可 以 进行 两 种 操作 : 获取 其 值 或 存 
储 新 值 ， 如 图 7-2 所 示 。 人 存储 右 包 括 一 条 用 于 设置 操作 模式 的 特殊 信 
KE 









单元 地 址 单元 地 址 






RAM 
读 模 式 


单元 的 当前 数据 





ba 
从 
NM 
k 
e 
aN 


单元 的 新 数据 


图 7-2 存储 妖 包 括 读 模式 与 写 模式 











O 二 进 制 数 以 2 为 基数 表示 ， 其 工作 原理 请 参见 附录 。 
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ee 它 称 为 字 节 。 设 置 为 “ 读 ” 
模式 时 ， 存 储 器 检索 保存 在 单元 中 的 字 节 ， 并 通过 8 条 数据 传输 线 输 
出 ， 如 图 7-3 所 示 。 








单元 地 址 RAM 
读 模式 


仿 索 到 的 数据 
图 7-3 ”从 存储 地 址 211 读 取 十 进 制 数 16 


设置 为 “ 写 ” 模 式 时 ， 存 储 副 从 数据 传输 线 获取 一 个 字 习 ， 并 将 其 
相应 的 单元 ， 如 图 7-4 所 示 。 





单元 地 址 


准备 存储 的 数据 
图 7-4 将 十 进 制 数 17 写 入 存储 地 址 212 


传输 相同 数据 的 一 组 信号 线 称 为 总 线 。 用 于 传输 地 址 的 8 条 信号 线 构成 
地 址 总 线 ， 用 于 在 存储 单元 之 间 传 输 数 据 的 另外 8 条 信号 线 构 成 数据 总 
线 。 地 址 总 线 息 单 癌 的 《〈 仅 用 于 接收 数据 ) ， 而 数据 总 线 是 双 同 的 《用 
于 发 送 和 接收 数据 )。 
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在 所 有 计算 机 中 ，CPU 5 RAM 无 时 无 刻 不 在 交换 数据 : CPU 不 断 从 


RAM 获取 指令 与 数据 ， 偶 尔 也 会 将 输出 与 部 分 计算 存储 在 RAM tF, 
如 图 7-5 所 示 。 


[ 地 址 总 线 


RAM 


See =] | 数据 总 线 WI 


7-5 CPU 5 RAM 相连 





1.1.2 CPU 


CPU 包括 大 和 干 称 为 寄存 器 的 内 部 存储 单元 ， 它 能 对 存储 在 这 些 宥 存 礁 中 
的 数字 执行 向 单 的 数学 运算 ， 也 能 在 RAM 与 寄存 莫 之 间 传 输 数 据 。 可 
以 指示 CPU 执行 以 下 典型 的 操作 : 


口 将 数据 从 存储 位 置 220 复制 到 寄存 器 3， 
口 将 寄存 器 3 与 寄存 如 1 中 的 数字 相 加 。 


CPU 可 以 执行 的 所 有 操作 的 集合 称 为 指令 集 ， 指 令 集中 的 每 项 操作 被 分 
配 一 个 数字 。 计 算 机 代码 本 质 上 起 表 示 CPU 操作 的 数字 序列 ， 这 些 操 
作 以 数字 的 形式 存储 在 RAM 中 。 输 入 /输出 数据 、 部 分 计算 以 及 计算 
机 代码 都 存储 在 RAM 中 。™ 


图 7-6 X H Intel 4004 操作 手册 ， 显 示 了 部 分 CPU 指令 映射 为 数字 的 方 
法 。 随 着 制造 工 忆 的 发 展 ，CPU 支持 的 操作 越 来 越 多 。 现 代 CPU 的 指 





O 通过 在 RAM 中 包含 重 写 部 分 代码 的 指令 ， 代 码 甚至 可 以 对 自身 修改 ， 这 是 计算 机 
病毒 逃避 反 病 毒 软件 检测 的 惯用 手法 。 与 之 类 似 ， 生 物 病毒 通过 改变 自身 的 DNA 
以 典 避 宿主 免疫 系统 的 打击 。 
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令 集 极为 庞大 ， 但 最 重要 的 指令 在 几 十 年 前 就 已 存在 。 


4004 Instruction Set 
BASIC INSTRUCTIONS 


OPR OPA DESCRIPTION OF OPERATION 
MNEMONIC D, D,D, D, D, D,D, D, 








NOP 0000 0000 Nooperation. 
INC 0110 RRRR Increment contents of register RRRR. E 
ADD 1000 RRRR Add contents of register RRRR to accumulator with carry. 
LD 1010 RRRR Load contents of register RRRR to accumulator. 
LDM 1101 DODD Load data DDDD to accumulator. 
= CLC 1111 0001 Cearcarry. o 
= IAC 1111 0010 Incrementaccumulator. o 
DAC 1111 1 000 Decrement accumulator. 





7-6 Intel 4004 数据 表 节 选 ， 显 示 了 如 何 将 操作 映射 为 数字 ; 1971 年 面世 的 
Intel 4004 是 全 球 第 一 代 CPU 


CPU 的 运行 永 无 休止 ， 它 不 断 从 存储 器 歼 取 并 执行 指令 。 这 个 周期 的 核 
心 是 PC 寄存 器 ，PC 是 “程序 计数 器 ”2 的 简称 。PC 是 一 种 特殊 的 寄存 
颖 ， 用 于 保存 下 一 条 待 执行 指令 的 存储 地 址 。CPU 的 工作 流程 如 下 : 


(1) 从 PC 指定 的 存储 地 址 获取 指令 ， 
(2) PC 自 增 ， 

G3) 执行 指令 ， 

(4) 返回 步骤 1， 


PC 在 CPU 上 电 时 复位 为 默认 值 ， 它 是 计算 机 中 第 一 条 符 执 行 指令 的 地 址 。 
这 条 指令 通常 是 一 种 不 可 变 的 内 置 程序 ， 用 于 加 载 计算 机 的 基本 功能 。” 


CPU 上 电 后 将 继续 执行 这 种 “获取 - 执行 ”周期 直至 关机 。 然 而 ， 如 
果 CPU 只 能 遵循 有 序 、 顺 序 的 操作 列表 ， 那 么 它 与 一 个 花哨 的 计算 器 
并 无 二 致 。CPU 的 神奇 之 处 在 于 可 以 指示 它 向 PC 中 写 入 新 值 ， 从 而 实 
MAITIE, 或 “ 跳 转 ”到 存储 絮 的 其 他 位 置 。 这 种 分 支 可 以 是 
有 条 件 的。 以 下 面 这 条 CPU 指令 为 例 :“ 如 果 寄 存 器 1 等 于 0， 将 PC 
设置 为 地 址 200”。 该 指令 相当 于 : 





D 这 里 的 PC 是 program counter 的 缩写 ， 不 要 与 “个 人 计算 机 ” (personal computer) 
Die, 
D 在 许多 个 人 计算 机 中 ， 这 种 程序 称 为 BIOS (基本 输入 输出 系统 )。 
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ze 
compute_this() 

else 
compute_that() 


仅 此 而 已 。 无 论 是 打开 网 站 、 玩 计算 机 游戏 抑或 编辑 电子 表格 ， 所 涉及 
的 计算 并 无 区 别 ， 都 古 一 系列 只 能 对 存储 强 中 的 数据 求 和 、 比 较 或 移动 
的 向 单 操作 。 


大 量 人 简单 的 操作 组 合 在 一 起 ， 就 能 表达 复 灯 的 过 程 。 以 经 典 的 《太空 侵 
略 者 》 游 戏 为 例 ， 其 代码 包括 大 约 3000 条 机 器 指令 。 











= 


和 
Amh E, iah, Ah ih h E h 这 
Ah ët, d, h dë d, h ah h i, 

SES PF SES PF TO TO O e 


a ës 下 


| 











图 7-7 1978 年 面世 的 《大 空 侵 略 者 》 经 常 被 视 为 有 史 以 来 最 具 影 响 力 的 电子 
游戏 


CPU 时 钟 早 在 20 世纪 80 年代,《 太 空 侵略 者 》 就 已 风靡 一 时 。 这 
个 游戏 在 配备 2 MHz CPU 的 街机 上 运行 。 "2 MHz” 表 示 CPU 的 时 钟 ， 
即 CPU 每 秒 可 以 执行 的 基本 操作 数 。 时 钟 频率 为 200 万 赫兹 (2 MHz) 
的 CPU 每 秒 大 约 可 以 执行 200 万 次 基本 操作 。 完 成 一 条 机 器 指令 需要 5 
到 10 次 基本 操作 ， 因 此 老式 街机 每 秒 能 运行 数 十 万 条 机 每 指令 。 

随 着 现代 科技 的 进步 ， 普 通 的 台式 计算 机 与 智能 手机 通常 配备 2 GHz 
CPU， 每 秒 可 以 执行 数 亿 条 机 粥 指令 。 时 至 今日 ， 多 核 CPU 已 投入 大 
规模 应 用 ， 如 四 核 2 GHz CPU 每 秒 能 执行 近 10 亿 条 机 器 指令 。 展 望 未 





7.1 体系 结构 | 117 


来 ，CPU 配备 的 核心 数量 或 许 会 越 来 越 多 。” 


CPU PRHA REEMA, PlayStation 的 游戏 CD 为 何 无 法 在 
台式 计算 机 中 运行 ? iPhone 应 用 为 何 无 法 在 Mac 中 运行 ? 原因 很 向 单 ， 
因为 它们 的 CPU 体系 结构 不 同 。 


x86 体系 结构 如 今 已 成 为 行业 标准 ， 因 此 相同 的 代码 可 以 在 大 部 分 个 人 
计算 机 中 执行 。 但 考虑 到 节 电 的 要 求 ， 手 机 采用 的 CPU 体系 结构 有 所 
不 同 。 不 同 的 CPU 体系 结构 意味 着 不 同 的 CPU 指令 集 ， 也 意味 着 将 指 
令 编 码 为 数字 的 方式 各 不 相同 。 台 式 计 算 机 CPU 的 指令 并 非 手 机 CPU 
的 有 效 指 令 ， 反 之 亦 然 。 


32 位 与 64 位 体系 结构 ”第 一 种 CPU 是 Intel 4004， 它 采用 4 位 体系 架 
Ho WALZ, XEF CPU 在 一 条 机 绒 指 令 中 可 以 对 最 多 4 位 二 进 制 数 执行 
求 和 、 比 较 与 移动 操作 。Intel 4004 的 数据 总 线 与 地 址 总 线 均 只 有 4 条。 


不 久之 后 ，8 位 CPU 开始 广 为 流 行 ， 这 种 CPU 用 于 运行 DOS2 的 早期 
个 人 计算 机 。20 世纪 八 九 十 年 代 ， 著 名 的 便携 式 游戏 机 Game Boy 就 采 
用 8 位 处 理工 。 这 种 CPU 可 以 在 一 条 指令 中 对 8 位 二 进 制 数 进行 操作 。 


技术 的 快速 发 展 使 16 位 以 及 之 后 的 32 位 体系 结构 成 为 主导 。CPU 寄存 
MEZER, ARA 32 位 数字 。 更 大 的 寄存 絮 目 然 催 生出 更 大 的 数据 
总 线 与 地 址 总 线 : 具有 32 条 信号 线 的 地 址 总 线 可 以 对 2“ 字 市 (4 GB) 
的 内 存 进 行 寻 址 。 


人 们 对 计算 能 力 的 淘 求 从 未 停止 。 计 算 机 程序 越 来 越 复杂 ， 消 耗 的 内 存 
越 来 越 多 ，4 GB 内 存 已 无 法 满足 需要 。 使 用 适合 32 位 寄存 右 的 数字 地 
址 对 超过 4 GB Me Err HEEN RT, HD 64 位 体系 结构 兴起 的 动 
因 ， 这 种 体系 结构 如 今 占 据 主 导 地 位 。64 位 CPU 可 以 在 一 条 指令 中 对 
极 大 的 数字 进行 操作 ， 而 64 位 寄存 妖 将 地 址 存储 在 海量 的 存储 空间 中 : 
2” 字 节 相 当 于 超过 170 (LF (GB). 


大 端 序 与 小 端 序 一 些 计 算 机 设计 师 认 为 ， 应 按 从 左 至 右 的 顺序 在 
RAM 与 CPU 中 存储 数字 ， 这 种 模式 称 为 小 端 序 。 另 一 些 计 算 机 设计 师 











D 2016 年 ， 研 究 人 员 宣 布 推出 一 种 包括 1000 个 核心 的 CPU, 
JI“ 磁盘 操作 系统 ”的 缩写 。 稍 后 将 讨论 操作 系统 。 
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则 倾 问 于 按 从 右 至 左 的 顺序 在 存储 器 中 写 入 数据 ， 这 种 模式 称 为 大 端 
序 。 因 此 ， 根 据 “ 字 市 序 ” 的 不 同 ， 二 进 制 序列 1-0-0-0-0-0-1-1 表示 的 
数字 也 有 所 不 同 。 


O kn: 2 +2 +20=131 
口 小 端 序 : 2” +24+2 = 193 


目前 的 大 部 分 CPU 采用 小 痪 序 模式 ， 但 同样 存在 许多 采用 大 凯 序 模式 
的 计算 机 。 如 采 大 痪 序 CPU 需要 解释 由 小 端 序 CPU 产生 的 数据 ， 则 必 
须 采取 措施 以 免 出 现 字 节 序 不 匹配 。 程 序 员 直 接 对 二 进 制 数 进行 操作 ， 
在 解析 来 目 网 络 交 换 机 的 数据 时 尤其 需要 注 革 这 个 问题 。 虽 然 目 前 多 数 
计算 机 采用 小 端 序 模式 ， 但 由 于 大 部 分 早期 的 网 络 路 由 如 使 用 大 问 序 
CPU， 所 以 因特网 流量 仍然 以 大 妆 序 为 基础 进行 标准 化 。 以 小 端 序 模式 
读 取 大 奖 序 数据 时 将 出 现 乱码 ， 反 之 亦 然 。 


模拟 器 “ 革 些 情况 下 ， 需 要 在 计算 机 上 运行 革 些 为 不 同 CPU 设计 的 代 
人 码 ， 以 便 在 没有 iPhone 的 情况 下 测试 iPhone 应 用 ， 或 玩 脸 入 人口 的 老 
式 超级 任天堂 游戏 。 这 是 通过 称 为 模拟 器 的 软件 来 实现 的 。 


模拟 恬 用 于 模仿 目标 机 绢 ， 它 假定 与 其 拥有 相同 的 CPU、RAM 以 及 其 
他 硬件 。 模 拟 絮 程序 对 指令 进行 解码 ， 并 在 模拟 机 如 中 执行 。 可 以 想 
见 ， 如 采 两 台 机 需 的 体系 结构 不 同 ， 那 么 在 一 台 机 磺 内 部 模拟 另 一 从 机 
絮 绝 韭 罗 事 。 好 在 现代 计算 机 的 速度 远 远 超过 之 前 的 机 备 ， 因 此 模拟 并 
非 无 法 实现 。 我 们 可 以 利用 Game Boy 模拟 器 在 计算 机 中 创建 一 个 虚拟 
的 Game Boy， 然 后 束 能 像 使 用 实际 的 Game Boy 那样 玩 游戏 。 











7.2 编译 器 


通过 对 计算 机 进行 编程 ， 可 以 完成 核磁 共振 成 像 、 声 音 识别 、 行 星 探 
索 以 及 其 他 许多 复杂 的 任务 。 值 得 注意 的 征 ， 计 算 机 执行 的 所 有 操作 
最 终 都 要 通过 人 简单 的 CPU 指令 完成 ， 即 归结 为 对 数字 的 求 和 与 比较 。 
而 Web 训 览 右 等 复杂 的 计算 机 程序 需要 数 百 万 乃至 数 十 亿 条 这 样 的 机 豆 
指令 。 
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但 我 们 很 少 会 直接 使 用 CPU 指令 来 编写 程序 ， 也 无 法 采用 这 种 方式 开 
发 一 个 晕 真 的 三 维 计 算 机 游戏 。 为 了 以 一 种 更 “自然” 且 更 紧 竣 的 方式 
表达 命令 , 人 们 创造 了 编程 语言 “。 我 们 使 用 这 些 语言 编写 代码 , 然后 通 
过 一 种 称 为 编译 器 的 程序 将 命令 转换 为 CPU 可 以 执行 的 机 妖 指 令 。 
我 们 用 一 个 人 简单 的 数学 类 比 来 解释 编译 器 的 用 途 。 假 设 我 们 向 茶 人 提 
问 ， 要 求 他 计算 5 的 阶乘 。 


g=] 


但 如 采 回 答 者 不 了 解 什么 症 阶 乘 ， 则 这 样 提 癌 并 无 意义 。 我 们 必须 采用 
更 简单 的 操作 来 重新 表述 问题 。 


SXx4x3X2X1=2 


不 过 ， 如 末 回 答 者 只 会 做 加 法 怎么 办 ? 我 们 必须 进一步 倍 化 问题 的 
表 


Be CG 


本 
SE Be e E e ee Be e a Get 


可 以 看 到 ， 表 达 计 算 的 形式 越 便 单 ， 所 需 的 操作 数量 越 多 。 计 算 机 代 
码 同样 如 此 。 编 译 禹 将 编程 语言 中 的 复 洒 指令 转换 为 等 效 的 CPU 指令 。 
结合 功能 强大 的 外 部 库 ， 就 能 通过 相对 较 少 的 儿 行 代码 表示 包含 数 十 亿 
条 CPU 指令 的 复杂 程序 ， 而 这 些 代 码 匈 于 理解 和 修改 。 


计算 机 之 父 文 伦 : 图 灵 发 现 ， 简 单 的 机 答 有 能 力 计 算 任 何 可 计算 的 事 

物 。 如 果 机 如 具 有 通用 的 计算 能 力 ， 那 么 它 必 须 能 遵循 包含 指令 的 程 

序 ， 以 便 : 

O 对 存储 强 中 的 数据 进行 读 写 ， 

D 执行 条 件 分 支 : 如 琳 存 储 地 址 具有 给 定 的 值 ， 则 跳 转 到 程序 的 为 一 
ds 

我 们 称 具有 这 种 通用 计算 能 力 的 机 絮 古 图 灵 完 备 的 。 无 论 计算 的 复杂 性 

或 难度 如 何 ， 都 可 以 采用 人 简单 的 读 取 / 写 入 /分 文 指 令 来 表达 。 只 要 分 





O 第 8 章 将 讨论 更 多 与 编程 语言 有 关 的 内 容 。 
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配 足 够 的 时 间 与 存储 空间 ， 这 些 指令 就 能 计算 任何 事物 。 


TT 
可 编程 的 新 
咖啡 机 | 
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某 些 极 客 让 人 鼎 为 扫 共 
7-8 “图 灵 完 备 ”( 取 自 http://geek-and-poke.com/) 


人 们 最 近 发 现 ， 一 种 称 为 MOV (数据 传送 ) 的 CPU 指令 是 图 灵 完 备 ” 
的 。 这 意味 着 仅 能 执行 MOV 指令 的 CPU 与 完整 的 CPU 在 功能 上 并 无 不 
H. 换言之 ， 通 过 MOV 指令 可 以 严格 地 表达 任何 类 型 的 代码 。” 


O 剑桥 大 学 的 Stephen Dolan 对 此 做 了 证 明 ， 感 兴趣 的 读者 可 以 阅读 他 的 论文 : http:/ 
www.cl.cam.ac.uk/%7Esd601/papers/mov.pdf, 译 者 广 
一 种 编译 器 可 以 将 任何 C 代码 编译 为 仅 支持 MOYV 指令 的 二 进 制 代码 : https:/ 


github.com/xoreaxeaxeax/movfuscator , 
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这 个 重要 概念 在 于 ， 无 论 简单 与 个 ， 如 采 程 序 能 采用 编程 语言 进行 纺 
码 ， 束 可 以 重 写 后 在 任何 图 灵 完 备 的 机 背 中 运行 。 编 译 背 是 一 种 神奇 的 
程序 ， 能 目 动 将 代码 从 复杂 的 语言 转换 为 简单 的 语言 。 





7.2.1 操作 系统 


从 本 质 上 讲 ， 编 译 后 的 计算 机 程序 是 CPU 指令 的 序列 。 如 前 所 述 ， 为 台 
式 计 算 机 编译 的 代码 无 法 在 智能 手机 中 运行 ， 因 为 二 者 采用 不 同 的 CPU 
体系 结构 。 不 过 ， 由 于 程序 必须 与 计算 机 的 操作 系统 通信 才能 运行 ， 编 
译 后 的 程序 也 可 能 无 法 在 共享 相同 CPU 架构 的 两 人 台 计 算 机 中 使 用 。 


为 实现 与 外 界 的 通信 ， 程 序 必 须 进行 输入 与 输出 操作 ， 如 打开 文件 、 在 
屏幕 上 显示 消 上 息 、 打 开 网 络 连 接 每 。 但 不 同 的 计算 机 采用 不 同 的 硬件 ， 
因此 程序 不 可 能 直接 支持 所 有 不 同类 型 的 屏 硕 、 声 卡 或 网 卡 。 


这 就 是 程序 依赖 于 操作 系统 执行 的 原因 所 在 。 借 助 操作 系统 的 帮助 ， 程 
序 可 以 宣 不 费力 地 使 用 不 同 的 硬件 。 程 序 创建 特殊 的 系统 调用 ， 请 求 操 
作 系 统 执行 所 需 的 输入 /输出 操作 。 编 译 器 人 负责 将 输入 /输出 命令 转换 
为 合适 的 系统 调用 。 

然而 ， 不 同 的 操作 系统 往往 使 用 互 不 兼容 的 系统 调用 。 人 例如， 与 macOS 
ak Linux 相 比 ，Windows 在 屏幕 上 打印 信息 所 用 的 系统 调用 有 所 不 同 。 
因此 ， 在 使 用 x86 外 理 器 的 Windows 中 编译 的 程序 ， 无 法 在 使 用 x86 
处 理 右 的 Mac 中 运行 。 除 针对 特定 的 CPU 体系 结构 外 ， 编 译 后 的 代码 
还 会 针对 特定 的 操作 系统 。 








7.2.2 编译 优化 


优秀 的 编译 器 致力 于 优化 它们 生成 的 机 吾 码 。 如 果 编 译 絮 认为 可 以 通过 
修改 部 分 代码 来 提高 执行 效率 ， 则 会 处 理 。 在 生成 二 进 制 输出 之 前 ， 编 
译 如 可 能 竺 试 应 用 数 百 条 优化 规则 。 


因此 ， 应 使 代码 多 于 阅读 以 利于 进行 做 优化 。 编 译 如 最 终 将 完成 所 有 细 
微 的 优化 。 例 如 ， 一 些 人 对 以 下 代码 顾 有 微 词 。 
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function factorial(n) 
tf n> 1 
return factorial(n - 1) * n 
else 
return 1 


他 们 认为 应 该 进行 以 下 修改 : 


function factorial(n) 
result é 1 
while n > 1 
result ée result * n 
nen- 1 
return result 
诚然 ， 在 不 使 用 递归 的 情况 下 执行 factorial 函数 将 消耗 较 少 的 计算 
资源 ， 但 仍然 没有 理由 因此 而 改变 代码 。 现 代 编译 器 将 自动 重 写 简单 的 
递归 国 数 ， 举 例如 下 。 


为 避免 进行 两 次 x+y 计算 ， 编 译 器 将 上 述 代码 重 写 为 : 

tl e x+y 

i e tl +1 

j e til 
应 专注 于 编写 清晰 且 目 解释 的 代码 。 如 末 性 能 出 现 问 题 ， 可 以 利用 分 析 
工具 寻找 代码 中 的 瓶 贷 ， 并 尝试 改 用 更 好 的 方法 计算 存在 问题 的 代码 。 
此 外 ， 避 免 在 不 必要 的 微 操 作 上 浪费 太 多 时 间 。 


但 在 某 些 情况 下 ， 我 们 希望 跳 过 编译 ， 接 下 来 将 对 此 进行 讨论 。 





7.2.3 ”脚本 语言 


某 些 语言 在 执行 时 并 未 被 直接 编译 为 机 絮 码 ， 这 些 语言 称 为 脚本 语言 ， 
包括 JavaScript, Python 以 及 Ruby。 在 脚本 语言 中 ， 代 码 由 解释 如 而 韭 
CPU 执行 ， 解 释 如 必 须 安装 在 运行 代码 的 机 絮 中 。 


解释 融 实 时 转译 并 执行 代码 ， 因 此 其 运行 速度 通常 比 编译 后 的 代码 慢 得 
多 。 但 另 一 方面 ， 程 序 员 随时 都 能 立即 运行 代码 而 无 须 等 待 编 译 过 程 。 
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对 于 规模 极 大 的 项 目 ， 编 译 可 能 耗 时 数 小 时 之 久 。 


Google 工程 师 必 须 不 断 编 译 大 量 代 码 ， 导 致 程序 员 “损失 ”了 很 多 时 间 
(图 7-9)。 由 于 需要 保证 编译 后 的 二 进 制 文件 有 更 好 的 性 能 ，Google 无 
法 切换 到 脚本 语言 。 公 司 为 此 开发 了 Go 语言， 它 的 编译 速度 极 快 ， 同 
时 仍然 保持 很 高 的 性 能 。 


排 在 首位 的 程序 员 会 理 偷 同人 异 品 : 
"ar, 





7.2.4 反 汇 编 与 逆向 工程 

给 定 一 个 已 编译 的 计算 机 程序 ， 无 法 在 编译 之 前 恢复 其 源 代码 。” 但 我 
们 可 以 对 二 进 制程 序 解 码 ， 将 用 于 编码 CPU 指令 的 数字 转换 为 人 类 可 
读 的 指令 序列 。 这 个 过 程 称 为 反 汇 编 。 

接 下 来 ， 可 以 查看 这 些 CPU 指令 ， 并 尝试 分 析 它 们 的 用 途 ， 这 就 是 所 
请 的 逆向 工程 。 某 些 反 汇编 程序 对 这 一 过 程 大 有 神 益 ， 它 们 能 自动 检测 
并 注释 系统 调用 与 常用 图 数 。 借 由 反 汇 编 工 具 ， 黑 客 对 二 进 制 代码 的 各 


O 至 少 目前 如 此 。 但 随 着 人 工 智能 的 发 展 ， 今 后 或 许 会 实现 。 
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地 下 黑客 经 常 分析 Windows、Photoshop、《 侠 盗 猎 车 手 》 等 授权 程序 中 
的 二 进 制 代码 ， 以 确定 哪 部 分 代码 负责 验证 软件 许可 证 。 墨 客 将 二 进 制 
代码 修改 ， 在 其 中 加 入 一 条 指令 ， 直 接 跳 转 到 验证 许可 证 后 执行 的 代 
码 部 分 。 运 行 修改 后 的 二 进 制 代码 时 ， 它 在 检查 许可 证 前 获取 注入 的 
JUMP 命令 ， 从 而 可 以 在 没有 付费 的 情况 下 运行 韭 法 的 盗版 副本 。 


在 秘密 的 政府 情报 机 构 中 ， 同 样 设 有 供 安全 研究 人 员 与 工程 师 研究 
iOS, Windows, TE 浏览 器 等 流行 消费 者 软件 的 实验 室 。 他 们 寻找 这 些 
程序 中 可 能 存在 的 安全 漏洞 ， 以 防御 网 络 攻击 或 对 高 价值 目标 的 入 侵 。 
在 这 类 攻击 中 ， 最 知名 的 当 属 “ 震 网 ”病毒 ， 它 是 美国 与 以 色 列 情报 机 
构 研制 的 一 种 网 络 武器 。 通 过 感染 控制 地 下 聚变 反应 堆 的 计算 机 ,“ 震 
网 ”延缓 了 伊朗 核 计划 。? 





7.2.5 ”开源 软件 


如 前 所 述 ， 我 们 可 以 根据 二 进 制 可 执行 文件 分 析 有 关 程 序 的 原始 指令 ， 
但 无 法 恢复 用 于 生成 二 进 制 文件 的 原始 源 代码 。 


在 没有 原始 源 代 码 的 情况 下 ， 即 使 可 以 稍 许 修改 二 进 制 文件 以 便 以 较 小 
的 方式 破解 ， 实 际 上 也 无 法 对 程序 进行 任何 重大 更 改 (如 添加 新 功能 )。 
一 些 人 推崇 协作 构建 代码 的 方式 ， 因 此 将 自己 的 源 代 码 开 放 供 他 人 修 
改 。 开源 ”的 主要 概念 就 在 于 此 : 所 有 人 都 能 目 由 使 用 与 修改 的 软件 。 
基于 Linux 的 操作 系统 (如 Ubuntu, Fedora 与 Debian) 是 开源 的 ， 而 
Windows 与 macOS 是 财产 的 。 


开源 操作 系统 有 一 个 有 趣 之 处 在 于 ， 任 何人 部 可 以 检查 源 代 码 以 寻找 安 
全 漏洞 。 现 已 证 实 ， 政 府 机 构 通 过 日 第 消费 者 软件 中 未 修补 的 安全 疡 
词 ， 对 数 百 万 平民 进行 利用 和 监视 。 








(DD“ 震 网 ”病毒 于 2010 年 6 月 被 首次 发 现 ， 相 关 计 划 代 号 为 “奥运 会 "。2016 年 2 月 
上 上映 的 纪录 族 《 零 日 》 详 细 描 述 了 “ 震 网 ”攻击 伊朗 核 设施 这 一 事件 。 一 译 者 注 
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但 对 开源 软件 而 言 ， 代 码 受到 的 关注 度 更 高 ， 因 此 恶意 的 第 三 方 与 政府 
机 构 很 难 植 入 监控 后 门 程序 。 使 用 macos 或 Windows 上 时， 用 户 必 须 相 
信 Apple 或 Microsoft 对 日 己 的 安全 不 会 构成 危害 ， 并 尽 最 大 努力 防止 
任何 严重 的 安全 漏 稠 。 而 开源 系统 置 于 公众 的 监督 之 下 ， 因 此 安全 词 洞 
被 名 视 的 可 能 性 大 为 降低 。 





7.3 ”和 仔 储 器 层次 结构 


我 们 知道 ， 计 算 机 的 操作 可 以 归结 为 使 CPU 执行 简单 的 指令 ， 这 些 指 
令 只 能 对 存储 在 CPU 寄存 絮 中 的 数据 操作 。 但 寄存 絮 的 存储 空间 通 切 
被 限制 在 1000 字 节 以 内 ， 这 意味 着 CPU 寄存 器 与 RAM 之 间 必 须 不 断 
进行 数据 传输 。 


如 采 存 储 震 访问 速度 过 慢 ，CPU 将 被 迫 处 于 空闲 状态 ， 以 等 待 RAM É 
成 数据 传输 。CPU 读 写 存储 人 左 中 数据 所 需 的 时 间 与 计算 机 性 能 直接 相 
关 。 提 高 存储 全 速度 有 助 于 加 快 计算 机 运行， 也 可 以 提高 CPU 访问 数 
据 的 速度 。CPU 能 以 近乎 实时 的 速度 (一 个 周期 以 内 ) ”访问 存储 在 寄 
存 融 中 的 数据 ， 但 访问 RAM 则 慢 得 多 。 





7.3.1 处 理 怖 与 存储 器 之 则 的 鸿沟 


近年 来 的 技术 发 展 使 得 CPU 速度 成 倍增 长 。 虽 然 存 储 磺 速度 同样 有 所 
提高 ， 但 却 慢 得 多 。CPU 与 RAM 之 间 的 这 种 性 能 差距 称 为 “处 理 器 
与 存储 器 之 间 的 鸿沟 。 我 们 可 以 执行 大 量 CPU 指令 ， 因 此 它们 很 “ 廉 
价 ”; 而 从 RAM 获取 数据 所 需 的 时 间 较 长 ， 因 此 它们 很 “昂贵 ”。 随 着 
两 者 之 间 的 差距 逐 淘 增 大 ， 提 高 存储 媳 访 问 效 率 的 重要 性 越发 明显 。 


O 对 于 时 钟 频率 为 1 GHz 的 CPU， 一 个 周期 的 持续 时 间 约 为 十 亿 分 之 一 秒 ， 这 是 光 
线 从 本 书 进 入 读者 眼中 所 需 的 时 间 。 
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图 7-10 过 去 几 十 年 中 处 理 器 与 存储 器 之 间 的 瀣 沟 
现代 计算 机 需要 大 约 1000 个 CPU 周期 (1 微 秒 左右 ) 从 BAM 获取 数 
据 。 这 种 速度 已 很 惊人 ,但 与 访问 CPU 寄存 絮 的 上 时间 相 比 仍然 较 慢 。 
减少 计算 所 需 的 RAM 操作 次 数 ， 是 计算 机 科学 家 追求 的 目标 。 


7.3.2 时间 局 部 性 与 空间 局 部 性 

在 尝试 尽量 减少 对 RAM 的 访问 时 ， 计 算 机 科学 家 开始 注意 到 两 个 事实 。 
o 时 间 局 部 性 : 访问 某 个 存储 地 址 时 ， 可 能 很 快 会 再 次 访问 该 地 址 。 

D 空间 局 部 性 : 访问 某 个 存储 地 址 时 ， 可 能 很 快 会 访问 与 乙 相 邻 的 地 址 。 
因此 ， 将 这 些 存 储 地 址 保存 在 CPU 寄存 绢 中 ， 有 助 于 避免 大 部 分 对 RAM 
的 “昂贵 ”操作 。 不 过 在 设计 CPU 芯片 时 ， 工 业 工 程 师 并 未 找到 可 行 


的 方法 来 容纳 足够 多 的 内 部 寄存 大 ， 但 他 们 仍然 发 现 了 如 何 有 效 地 利用 
时 间 局 部 性 与 空间 局 部 性 。 接 下 来 将 对 此 进行 讨论 。 








O 在 两 个 面对面 的 人 之 间 ， 声 波 传播 需要 大 约 10 微 秒 。 
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7.3.3 一 级 缓存 


可 以 构建 一 种 集成 在 CPU 内 部 且 速 度 极 快 的 辅助 存储 器 ， 这 就 是 一 
级 缓存 。 将 数据 从 一 级 缓存 读 入 寄存 强 ， 仪 比 直 接 从 寄存 如 获取 数据 
稍 慢 。 

利用 一 级 缓存 ， 我 们 将 可 能 访问 的 存储 地 址 中 的 内 容 复 制 到 CPU 寄存 
载 附近 ， 借 此 以 极 快 的 速度 将 数据 载 入 CPU 寄存 袁 。 将 数据 从 一 级 组 
存 读 入 寄存 右 仪 需 大 约 10 个 CPU 周期 ， 速 度 是 从 RAM 获取 数据 的 近 
百倍 。 


借 由 10 KB 左右 的 一 级 缓存 ， 并 合理 利用 时 间 局 部 性 与 空间 局 部 性 ， 超 
过 一 半 的 RAM 访问 调用 仪 通过 缓存 就 能 实现 。 这 一 创新 使 计算 技术 
发 生 了 翻天 窗 地 的 变化 。 一 级 缓存 可 以 极 大 缩短 CPU 的 等 待 时 间 ， 使 
CPU 将 更 多 时 间 用 于 实际 计算 而 非 处 于 空闲 状态 。 











7.34 二 级 缓存 


提高 一 级 缓存 的 容量 有 助 于 减少 从 RAM 获取 数据 的 操作 ， 进 而 缩短 
CPU 的 等 待 时 间 。 但 是 ， 增 大 一 级 缓存 的 同时 也 会 降低 它 的 速度 。 在 一 
级 缓存 达到 50 KB 左右 时 ， 继 续 增加 其 容量 就 要 付出 极 高 的 成 本 。 更 好 
的 方案 是 构建 一 种 称 为 二 级 缓存 的 缓存 。 二 级 缓存 的 速度 稍 慢 ， 但 容量 
比 一 级 缓存 大 得 多 。 现 代 CPU 配备 的 二 级 缓存 约 为 200 KB， 将 数据 从 
二 级 缓存 读 入 CPU 寄存 绢 需要 大 约 100 个 CPU 周期 。 


我 们 将 最 有 可 能 访问 的 地 址 复制 到 一 级 缓存 ， 较 有 可 能 访问 的 地 址 复制 
P RRT. WMA CPU 没有 在 一 级 缓存 中 找到 茶 个 存储 地 址 ， 仍 然 可 
以 和 尝试 在 二 级 缓存 中 搜索 。 仅 当 该 地 址 既 不 在 一 级 缓存 、 也 不 在 二 级 缓 
存 中 时 ，CPU 才 需 要 访问 RAM, 


目前 ， 不 少 制造 商 推 出 了 配备 三 级 缓存 的 处 理 强 。 三 级 缓存 的 容量 比 二 
级 缓存 大 ， 虽 然 速度 不 及 二 级 缓存 ， 但 仍然 比 RAM 快 得 多 。 一 级 /二 
级 /三 级 缓存 非常 重要 ， 它 们 占据 了 CPU 芯片 内 部 的 大 部 分 硅 厂 空间 。 
见 图 7-11。 
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图 7-11 显微镜 下 的 Intel Haswell-E 处 理 器 : 中央 的 方形 结构 是 容量 为 20 MB 
的 三 级 缓存 


使 用 一 级 /二 级 /三 级 缓存 能 显 考 提高 计算 机 的 性 能 。 在 配备 200 KB 
的 二 级 缓存 后 ，CPU 发 出 的 存储 请 求 中 仅 有 不 到 10% 必须 直接 从 RAM 
AEN. 

读者 今后 购买 计算 机 时 ， 对 于 所 挑选 的 CPU， 请 记 住 比较 一 级 /二 级 / 
三 级 缓存 的 容量 。CPU 越 好 ， 绥 存 越 大 。 一 般 来 说 ， 建 议 选择 一 款 时 钟 
频率 稍 低 但 缓存 容量 较 大 的 CPU, 














7.35 ”第 一 级 存储 器 与 第 二 级 存储 器 


如 前 所 述 ， 计 算 机 配 有 不 同类 型 的 存储 如 ， 它 们 按 层次 结构 排列 。 性 能 
最 好 的 存储 絮 容 量 有 限 且 成 本 极 高 。 沿 层次 结构 同 下 ， 可 用 的 存储 空间 
越 来 越 多 ， 但 访问 速度 越 来 越 慢 。 
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图 7-12 存储 器 层次 结构 示意 图 


在 存储 絮 层 次 结构 中 ， 位 于 CPU 寄存 絮 与 缓存 之 下 的 是 BAM. "CG 
存储 当前 运行 的 所 有 进程 的 数据 与 代码 。 截 至 2017 年 ， 计 算 机 配备 的 
RAM 容量 通常 为 1 GB 到 10 GB。 但 在 许多 情况 下 ，RAM 可 能 无 法 满 
足 操作 系统 以 及 所 有 运行 程序 的 需 


因此 ， 我 们 必须 深入 探究 存储 副 层 次 结构 ， 使 用 位 于 RAM 之 下 的 硬 
盘 。 截 至 2017 年 ， 计 算 机 配备 的 硬盘 容量 通 冰 为 数目 吉 字 攻 ， 足 以 容 
纳 当 前 运行 的 所 有 程序 数据 。 如 果 RAM 已 满 ， 当 前 的 空 几 数据 将 被 移 
至 硬盘 以 释放 部 分 内 存 空间 。 


问题 在 于 ， 硬 盘 的 速度 非常 慢 ， 它 一 般 需 要 100 万 个 CPU 周期 (IS 
秒 ) O 在 磁盘 与 RAM 之 间 传 输 数据 。 从 磁盘 访问 数据 看 似 很 快 ， 但 不 
ww, HRAM 仅 需 1000 个 周期 ， 而 访问 磁盘 需要 100 万 个 周期 。 
RAM 通 销 称 为 第 一 级 存储 器 ， 而 存储 程序 与 数据 的 磁盘 称 为 第 二 级 存 
储 器 。 
CPU 无 法 直接 访问 第 二 级 存储 如 。 执 行 保存 在 第 二 级 存储 絮 中 的 程序 之 
前 ， 必 须 将 其 复制 到 第 一 级 存储 器 。 实 际 上 ， 每 次 启动 计算 机 时 ， 即 便 
是 操作 系统 也 要 从 磁盘 复制 到 RAM， 否 则 CPU 无 法 运行 。 





O 标准 照片 在 大 约 4 毫秒 内 捕捉 光线 。 
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确保 RAM 永 不 枯竭 ”在 典型 活动 期 间 ， 确 保 计 算 机 处 理 的 所 有 数据 与 
程序 都 能 载 和 人 RAM 至 关 重 要 ， 人 否则 计算 机 将 不 断 在 磁盘 与 RAM 之 间 
交换 数据 。 由 于 这 项 操作 的 速度 极 慢 ， 计 算 机 性 能 将 严重 下 降 ， 甚 至 无 
法 使 用 。 这 种 情况 下 ， 计 算 机 不 得 不 伦 费 更 多 时 间 等 竺 数据 传输 ， 而 无 
法 进行 实际 的 计算 。 

当 计 算 机 不 断 将 数据 从 磁盘 读 入 RAM 时 ， 则 称 计 算 机 处 于 抖动 模式 。 
必须 对 服务 右 进 行 持续 监控 ， 如 采 服 务 癸 开始 处 理 无 法 载 和 人 RAM 的 数 
据 ， 那 么 拌 动 可 能 会 叶 致 整个 服务 如 月 闹 。 银 行 或 收银 机 前 将 因此 排 起 
长 队 ， 而 服务 员 除 了 责怪 发 生 抖 动 的 计算 机 系统 之 外 别 无 他 法 。 内 存 不 
足 或 许 是 寻 致 服务 合 故 障 的 主要 原因 之 一 。 














7.3.6 ”外 部 存储 顺 与 第 三 级 存储 怖 


我 们 继续 沿 存 储 缕 层次 结构 加 下 分 析 。 在 连接 到 网 络 之 后 ， 计 算 机 就 能 
访问 由 其 他 计算 机 管理 的 存储 器 。 它 们 要 么 位 于 本 地 网 络 ， 要 么 位 于 
因特网 ( 即 云 端 )。 但 访问 这 些 数据 所 需 的 时 间 更 长 : 读 取 本 地 磁盘 需 
要 1 训 秒 ， 而 歼 取 网 络 中 的 数据 可 能 耗 时 数 百 宣 秒 。 网 络 包 从 一 台 计 算 
机 传输 到 另 一 台 计 算 机 大 约 需 要 10 毫秒 ， 如 果 经 由 因特网 传输 则 需要 
200 bla) 300 诸 秒 ， 与 肥 眼 的 时 间 相 仿 。 


位 于 存储 絮 层 次 结构 底部 的 是 第 三 级 存储 器 ， 这 种 存储 设备 并 非 总 古 在 
Ze nl HO, (Cd Wmd CD 中 存储 数 百 万 吉他 慷 的 数据 成 本 较 低 ， 
但 访问 这 类 介质 中 的 数据 时 ， 需 要 将 介质 插入 条 种 读 取 设备 ， 这 可 能 和 需 
要 数 分 钟 甚至 数 天 之 入 不妨 尝试 让 IT 部 门 在 周 五 晚上 备份 磁带 中 的 
数据 ……)。 有 鉴于 此 ， 第 三 级 存储 右 仅 适合 归档 很 少 访问 的 数据 。 














7.3.7 存储 技术 的 发 展 趋势 


一 方面 ， 很 难 显 者 改进 “快速 ”存储 右 〈 位 于 存储 堪 层 次 结构 顶端 ) 
所 用 的 技术 ， 另 一 方面 ， 慢 速 ”存储 奏 的 速度 越 来 越 快 ， 价 格 也 越 来 
越 低 。 几 十 年 来 ， 硬 盘存 储 的 成 本 一 直 在 下 降 ， 这 种 趋势 似乎 还 将 持续 
下 去 。 
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新 技术 也 使 磁盘 的 速度 得 以 提高 。 人 们 正 从 旋转 磁盘 转向 固态 硬盘 
(SSD)， 它 没有 动 件 ， 因 而 更 快 、 更 可 靠 且 更 省 电 。 


采用 SSD 技术 的 磁盘 正 变 得 越 来 越 便宜 且 越 来 越 快 ， 但 其 价格 仍然 不 
非 。 有 鉴于 此 ， 一 些 制 造 商 推出 了 同时 采用 SSD 与 磁 技术 有 的 混合 磁盘 。 
后 者 将 访问 频率 较 高 的 数据 存储 在 SSD 中 ， 访 问 频率 较 低 的 数据 存储 
在 速度 较 慢 的 磁盘 中 。 当 需要 频 莹 访问 原先 不 经 第 访问 的 数据 时 ， 则 将 
其 复制 到 混合 驱动 絮 中 速度 较 快 的 SSD。 这 与 CPU 利用 内 部 缓存 提高 
RAM 访问 速度 的 技巧 顾 为 类 似 。 








$10 000 000 
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图 7-13 cn (GB) 的 磁盘 存储 成 本 
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这 一 章 介绍 了 一 些 基 本 的 计算 机 工作 原理 。 任 何 可 计算 的 事物 都 能 采用 
简单 的 指令 来 表示 。 为 将 复杂 的 计算 命令 转换 为 CPU 可 以 执行 的 简单 
指令 ， 需 要 使 用 一 种 称 为 编译 器 的 程序 。 计 算 机 之 所 以 能 进行 复杂 计 
算 ， 仅 仅 是 因为 CPU 可 以 执行 大 量 基 本 操作 。 


计算 机 的 处 理 右 速度 很 快 ， 但 存储 龙 相 对 较 慢 。CPU 并 非 以 随机 方式 访 
问 存 储 副 ， 而 古 体 循 空间 局 部 性 与 时 间 局 部 性 原理 。 因 此 ， 可 以 将 访问 
频率 较 高 的 数据 缓存 在 速度 更 快 的 存储 如 中 。 这 一 原则 在 多 个 级 别 的 组 
存 中 得 到 了 应 用 : 从 一 级 缓存 直到 第 三 级 存储 副 ， 不 一 而 足 。 
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这 一 革 讨 论 的 缓存 原则 可 以 应 用 于 多 种 场景 。 确 定 应 用 程序 频 营 使 用 的 
数据 ， 并 设法 提高 这 部 分 数据 的 访问 速度 ， 是 缩短 计算 机 程序 运行 时 间 
Hieren — o 





口 《 计 算 机 组 成 : 结构 化 方法 》，Andrew S. Tanenbaum 等 车 
o 《现代 编译 原理 : C 语言 描述 》”，Andrew W. Appel E% 


O 该 书 修订 版 已 由 人 民 邮 电 出 版 社 出 版 ， 详 见 http:/wwwi.ituring.com.cn/book/1984。 


第 8 音 
程序 设计 


如 果 有 人 表示 “我 希望 有 一 种 编程 语言 ， 只 要 说 出 我 的 目标 ， 
它 就 能 帮 我 实现 ”， 那 么 还 是 给 他 一 个 棒 棒 糖 吧 。 
一 一 艾 伦 . 佩 利 2 


我 们 希望 自己 的 思想 能 被 计算 机 理解 ， 所 以 采用 编程 语言 来 表达 我 们 的 
命令 ， 因 为 它 是 一 种 机 器 可 以 理解 的 语言 。 要 么 聘用 一 位 程序 员 ， 要 么 
置身 于 科幻 电影 之 中 ， 否 则 我 们 无 法 仅 用 “莎士比亚 式 ” 英 语 告诉 计算 

机 该 做 什么 。 目 前 ， 只 有 程序 员 能 随心 所 欲 地 赤红 计算 机 。 而 随 着 对 编 
程 语言 的 理解 日 益 深 入 ， 读 者 作为 程序 员 的 水 平 也 会 随 之 提高 。 这 一 章 
将 讨论 以 下 内 容 : 


O 找 出 控制 代码 的 秘密 语言 学 
x 使 用 变 ns 
在 不 同 的 范式 下 思考 解决 方案 


这 一 草 不 会 涉及 计算 机 科学 中 的 句法 和 话 法 形式 。 放 松 一 下 ， 继 组 
阅读 ! 





8.1 语言 学 


虽然 编程 语言 千差万别 ， 但 它们 存在 的 目的 都 是 为 了 操作 信息 。 编 程 语 
言 依 靠 3 种 基本 的 构建 模块 来 实现 这 一 点 值 表示 信息 ， 表 达 式 产生 
值 ， 语 句 使 用 值 向 计算 机 发 出 指令 。 

D EE. Kä (1922—1990), 美国 计算 机 科学 家 ， 曾 在 普 渡 大 学 、 卡 内 基 理 工学 


院 、 耶 和 鲁 大 学 、 加 州 理工 学 院 等 高 校 任教 ， 为 美国 培养 了 大 批 计算 机 科学 人 才 。 
II 设计 技术 与 编译 给 构造 方面 的 贡献 ， 佩 利于 1966 年 获得 首届 图 灵 
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8.1.1 值 


值 可 以 编码 的 信息 类 型 因 话 言 而 异 。 在 最 基本 的 语言 中 ， 值 仅 能 编码 
整数 或 浮 点 数 "” 这 类 非常 简单 的 信息 。 随 着 语言 越 来 越 复杂 ， 字 符 (以 
及 后 来 的 字符 串 ) 也 开始 作为 值 进行 处 理 。C 语言 支持 创建 结构 体 ， 
以 便 对 其 他 值 组 构成 的 值 进行 定义 。 例 如 ， 我 们 可 以 创建 一 个 名 为 
coordinate 的 值 类 型 ， 它 包括 纬度 与 经 度 两 个 浮 点 数 。 


值 的 重要 性 毋庸 置疑 ， 因 此 又 被 称 为 编程 语言 的 “头等 公民 。 换 言 之 ， 
编程 语言 文 持 与 值 有 关 的 各 种 操作 : 值 可 以 在 运行 时 创建 ， 也 可 以 作为 
参数 传递 给 函数 并 由 国 数 返 回 。 


8.1.2 RIAR 


可 以 通过 编写 字面 量 或 调用 函数 两 种 方式 创建 值 。 下 面 就 是 一 个 字面 量 
Zen, 
3 


我 们 仅 通 过 编写 3 就 创建 了 一 个 值 3 一 一 非常 简单 。 其 他 类 型 的 值 也 可 
以 作为 字面 量 创建 。 在 大 部 分 编程 语言 中 ， 输 入 "hello world" 就 能 
创建 字符 串 值 hello world。 函 数 则 有 所 不 同 ， 它 根据 在 其 他 位 置 进行 编 
码 的 方法 或 过 程 来 生成 值 ， 例 如 ; 

getPacificTime() 
上 述 表 达 式 创建 了 一 个 与 洛杉矶 当前 时 间 相 等 的 值 。 如 琳 当 前 时 间 为 竣 
晨 4 点 ， 则 方法 将 返回 4。 
运算 符 是 所 有 编程 语言 包含 的 另 一 种 基本 元 素 ， 它 将 简单 的 表达 却 连 接 
起 来 以 构成 更 复杂 的 表达 式 。 例 如 ， 可 以 通过 + 运算 符 创 建 一 个 与 纽约 
时 间 相 等 的 值 。 




















O 浮 点 数 通常 用 于 表示 带 有 小 数 的 数字 。 


简单 表达 式 
3 + getPacificTime() 





如 采 洛 杉 矶 时 间 为 姿 晨 4 点 ， 则 上 述 表达 式 将 简化 为 7。 实 际 上 ， 计 算 
机 将 用 户 编写 的 任何 表达 式 位 化 为 单个 值 。 较 大 的 表达 式 通 过 运算 符 与 
其 他 表达 式 相 结合 ， 从 而 构成 更 大 的 表达 式 。 即 便 是 最 复杂 的 表达 式 ， 
最 终 也 归结 为 对 单个 值 的 求 值 。 


除 字面 量 、 运 算 符 与 函数 之 外 ， 表 达 式 也 可 以 包含 括号 以 控制 运算 符 优 
先 级 。 例 如 ， 表 达 式 (2 + 4 计算 为 2， 最 终结 果 为 36 而 表达 式 2 十 玫 
计算 为 2+ 16， 最 终结 果 为 18。 


8.1.3 “语句 


表达 式 用 于 表示 值 ， 而 语句 用 于 指示 计算 机 执行 菜 种 操作 。 例 如 ， 
print("hello world") 语句 将 打印 hello world 298. 


9 
x 
O 
a 
oi 
x 
加 
D 
口 





极 客 诞生 


8-1 “Hello World”( 取 自 http://geek-and-poke.com/) 
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更 复杂 的 语句 包括 if, while 以 及 for， 不 同 的 编程 语言 支持 不 同类 型 
HI Ae 

定义 ” 某 些 编程 语言 提供 称 为 定义 的 特殊 语句 ， 它 通过 添加 不 存在 
的 实体 (如 新 的 值 或 函数 ) “来 改变 程序 状态 。 为 引用 所 定义 的 实体 ， 
需要 将 名 称 与 实体 关联 起 来 ， 这 就 是 所 谓 的 名 称 绑 定 。 例 如 ， 名 称 
getPacificTime 必须 与 某 个 位 置 的 国 数 定义 相互 绑 定 。 


8.2 SẸ 


变量 是 最 重要 的 名 称 绑 定 ， 即 名 称 与 值 乙 同 的 绑 定 。 变 量 将 名 称 与 保存 
值 的 存储 地 址 关联 在 一 起 ， 作 为 “别名 ”使 用 。 一 般 通 过 赋值 运算 符 来 
创建 变量 。 在 本 书 第 1 草 讨 论 的 伪 代 码 中 ， 赋 值 运算 符 写 作 一 。 

pi < 3.142 
而 大 部 分 编程 语言 将 赋值 运算 符 写 作 =。 某 些 语言 黄 至 要 求 在 定义 名 称 
之 前 将 其 声明 为 变量 ， 最 终结 末 如 下 。 





var pi 

pi = 3.142 
上 述 语句 保留 一 个 内 存 块 ， 在 其 中 写 入 值 3.142， 并 将 变量 名 pi 与 内 存 
块 地 址 关联 在 一 起 。 


8.2.1 变量 类 型 


在 大 部 分 编程 语言 中 ， 必 须 为 变量 指定 一 种 类 型 《如 整数 、 序 点数 或 字 
符 串 ) ， 以 便 程序 了 解 如 何 解 释 在 变量 内 存 块 中 读 取 的 1 和 0， 也 有 助 
于 在 处 理 变 量 时 发 现 错误 。 如 采 一 个 变量 为 字符 串 类 型 ， 另 一 个 变量 为 
整数 类 型 ， 那 么 对 二 者 求 和 并 无 意义 。 


类 型 检查 包括 静态 与 动态 两 种 方式 。 静 态 类 型 检查 要 求 程 序 员 在 使 用 所 
有 变量 前 声明 它们 的 类 型 ， 以 C 与 C++ 等 编程 语言 为 例 。 











Co 


O 某 些 情况 下 ， 可 以 从 预 编 码 的 外 部 库 导 入 实体 。 
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float pi; 

Di Ss 2, 142; 
根据 上 述 语句 的 声明 ， 名 为 pi DUU TS CO Sr Ire, en 
态 类 型 语言 可 以 在 编译 代码 时 应 用 其 他 优化 ， 鞭 至 在 执行 代码 前 检测 淤 
在 的 错误 。 不 过 ， 每 次 使 用 变量 前 都 要 进行 类 型 声明 或 许 有 些 乏 味 。 
茶 些 语 言 倾 问 于 使 用 动态 类 型 检查 。 这 种 情况 下 ， 任 何 变量 可 以 存储 任 
何 类 型 的 值 ， 因 此 无 须 进 行 类 型 声明 。 但 在 代码 执行 阶段 ， 程 序 在 处 理 
变量 时 将 实施 额外 的 类 型 检查 ， 以 确保 变量 之 间 的 操作 不 会 出 现 问题 。 





8.2.2 ”变量 作用 域 


如 采 所 有 名 称 绑 定 在 程序 的 所 有 点 都 征 可 用 且 有 效 的 ， 那 么 程序 议 计 将 
变 得 极其 困难 。 随 着 程序 越 来 越 大 ， 相 同 的 变量 名 (如 time、length 
或 speed) 最终 可 能 会 出 现在 无 关 的 代码 块 中 。 


例如 ， 用 户 由 于 踊 忽 在 程序 的 两 个 点 都 定义 了 一 个 名 为 length 的 变量 ， 
那么 区 会 出 现 问 题 。 更 粳 糙 的 征 ， 如 东 再 寻 入 一 个 同样 使 用 length 变 
量 的 库 ， 则 用 户 代码 与 导入 代码 中 的 length 变量 将 发 生 冲 突 。 


为 避免 冲突 ， 名 称 绑 定 对 束 个 源 代 码 无 效 。 变 量 的 作用 域 定义 了 变量 的 
有 效 位 置 以 及 可 供 使 用 的 冰 围 。 根 据 大 部 分 语言 的 设置 ， 变 量 仅 在 定义 
它 的 国 数 内 部 有 效 。 


在 程序 的 某 个 给 定点 ， 当 前 的 上 下 文 (或 称 环境 ) 表示 所 有 可 用 名 称 绑 
定 的 集合 。 一 般 来 说 ， 执 行 流离 开 茶 个 上 下 文 后 ， 定 义 在 该 上 下 文中 的 
变量 将 被 立即 删除 并 从 计算 机 内 存 中 释放 。 虽 然 不 建议 这 样 处 理 ， 但 用 
户 也 可 以 绕 开 上 述 规则 ， 创 建 在 程序 任何 位 置 都 能 访问 的 变量 ， 即 全 局 


< ES. 
变量 。 


命名 空间 构成 了 所 有 全 局 可 用 的 名 称 的 集合 。 用 户 应 密切 关注 程序 的 命 
名 空间 ， 并 使 命名 空间 尽 可 能 小 。 如 来 命名 空间 很 大 ， 发 生 名 称 促 突 的 
可 能 性 也 会 增加 。 


回程 序 的 命名 空间 添加 名 称 时 ， 应 最 大 限度 减少 所 添加 的 名 称 数量 。 例 
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如 ， 在 守 入 外 部 模块 时 ， 只 加 入 准备 使 用 的 函数 名 。 好 的 模 岂 不 应 要 求 用 
户 为 命名 空间 添加 过 多 的 内 容 ， 加 入 不 必要 的 名 称 会 导致 命名 空间 污染 。 


8.3 沁 式 


范式 古 定 义 科 学 领域 的 概念 与 实践 的 特定 集合 ， 它 对 处 理 问题 的 方法 、 
使 用 的 技术 以 及 解决 方案 的 结构 提出 指导 性 方针 。 例 如 ， 牛 顿 学 派 与 相 
IHE FIEFIA EEN. 


KIET KIEW, OEA AEP FR NA IEE 
式 。 编 程 范 式 体现 了 程序 设计 领域 的 观点 ， 它 将 指导 用 户 的 编程 风格 与 
技术 。 


我 们 可 以 在 程序 中 使 用 一 种 或 多 种 光 式 ， 但 使 用 哪 种 编程 语言 ， 最 好 就 
使 用 该 语言 所 基于 的 范式 。20 世纪 40 年 代 出 现 的 第 一 代 计 算 机 需要 手 
动 编程 ， 通 过 拨 动 开关 将 1 和 0 载 和 计算 机 内 存 。 程 序 设计 一 直 在 不 断 
发 展 ， 苑 式 的 出 现 使 人 们 能 编写 更 高 效 、 更 复杂 、 更 快速 的 代码 。 


存在 3 种 主要 的 编程 冰 式 ， 它 们 是 命令 式 编程 、 声 明 式 编程 与 逆 辑 编 
程 。 道 憾 的 征 ， 大 多 数 程序 员 仅 了 解 第 一 种 沌 式 的 正确 用 法 。 稳 担 全 
部 3 种 范式 至 关 重 要 ， 这 有 助 于 从 每 种 编程 语言 提供 的 特性 与 机 会 中 获 
蔓 ， 从 而 最 大 限度 近 高 编程 效率 。 








8.3.1 命令 式 编程 

命令 式 编程 范式 通过 特定 的 命令 指示 计算 机 在 每 一 步 必须 执行 的 操作 。 
每 条 命令 都 会 改变 计算 机 的 状态 ， 构 成 程序 的 命令 序列 将 依次 执行 。 
是 第 一 种 编程 艺 式 ， 因 为 它 是 计算 机 工作 方式 的 目 然 延 伸 。 计 算 总 是 
通过 一 条 接 一 条 执行 的 CPU 指令 完成 。 每 种 计算 机 程序 最 终 都 由 遵循 
这 种 了 犯 式 的 计算 机 所 执行 。 

命令 式 编 程 是 迄今 为 止 最 为 人 所 熟知 的 缉 式 。 实 际 上 ， 许 多 程序 员 仅 熟 
悉 这 种 汇 式 。 它 也 是 人 类 工作 方式 的 自然 延伸 :我们 采用 这 种 冰 式 描述 


4> 
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MERI, AEAEE H AE. IET RAE LERI 
厌倦 时 ， 束 会 将 这 些 指令 编写 为 程序 并 交 由 计算 机 执行 。 程 序 员 的 懒惰 
众生 出 许多 重要 的 事物 。 


ik AATA e fa 的 系统 ,。 


fe T REAO FE Taiz 
传 





8-2 “一 般 性 问题 ”( 取 自 https://xkcd.cony) 


机 器 码 编程 早期 的 程序 员 不 得 不 使 用 1 和 0 手动 将 代码 输入 计算 机 。 
他 们 对 此 感到 厌倦 ， 认 为 使 用 助 记 符 编 写 CPU 指令 序列 更 为 有 趣 ， 如 
CP 代表 “复制 ”指令 ，MOV 代表 “移动 ”指令 ，CMP 代表 “比较 指 
令 ， 不 一 而 足 。 程 序 员 后 来 编写 了 一 种 程序 ， 可 以 将 助 记 码 转换 为 等 效 
的 二 进 制 数 ， 再 交 由 计算 机 执行 。 汇 编 语言 由 此 诞生 。 


使 用 这 种 助 记 符 编 写 的 程序 ， 其 可 读 性 要 远 远 高 于 等 效 的 1 和 0。 这 些 
早期 的 助 记 符 以 及 这 种 编程 风格 至 今 仍 在 广泛 使 用 。 现 代 CPU 支持 的 
指令 越 来 越 复杂 ， 人 们 也 创造 了 更 多 的 助 记 符 ， 但 基本 原理 并 未 改变 。 


汇编 语言 用 于 对 电子 微波 、 车 载 计算 机 这 类 系统 进行 编程 。 这 种 编程 风 
格 同 样 适用 于 要 求 极 致 性 能 、 哪 但 市 省 少许 CPU 周期 也 具有 重要 意义 
TA 


设想 我 们 在 优化 一 台 高 性 能 Web DES AR O EM, OR 
仿 将 这 个 瓶颈 转换 为 汇编 代码 并 进行 检查 。 很 多 情况 下 ， 我 们 可 以 修改 
代码 以 减少 所 用 的 指令 。 低 级 语言 有 时 支持 在 编程 语言 的 普通 代码 中 插 
入 机 器 语言 ， 从 而 实现 这 种 精细 优化 。 借 由 机 强 码 ， 用 户 可 以 绝对 控制 
代码 运行 时 CPU 实际 执行 的 操作 。 


结构 化 编程 ”程序 起 初 通过 60T0 命令 来 控制 执行 流 ， 可 以 使 执行 跳 转 
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到 代码 的 其 他 部 分 。 但 随 着 程序 越 来 越 复杂 ， 理 解 程序 用 途 变 得 几 无 可 
能 。 不 同 的 执行 流 与 60TO 和 JUMP 命令 交织 在 一 起 ， 形 成 所 谓 的 面条 
式 代码 了”。 戴 克 斯 特 拉 于 1968 年 发 表 了 著名 的 “GOTO ARW” O, He 
5| 发 了 一 场 半 命 。 代 码 开始 按 逻 辑 进 行 划 分 ， 程序 员 不 再 使 用 专门 的 
GOTO 语句 ， 而 代 之 以 控制 结构 (Gf, else, while, for 等 )， 程 序 由 
此 变 得 更 容易 编写 和 调试 。 


过 程式 编程 ”过 程式 编程 是 程序 设计 乙 术 发 展 的 下 一 个 阶段 ， 它 将 代码 
组 织 到 过 程 中 ， 在 避免 代码 重复 的 同时 也 提高 了 代码 的 可 重用 性 。 例 
如 ， 我 们 可 以 创建 一 个 将 公制 单位 转换 为 美式 美制 单位 的 函数 ， 然 后 调 
用 这 个 函数 ， 从 而 在 需要 时 重用 相同 的 代码 。 这 使 得 结构 化 编程 的 效 
率 进一步 提高 。 利 用 过 程 更 容易 对 相关 代码 分 组 ， 将 它们 划分 为 不 同 


的 逻辑 部 分 。 








8.3.2 ”声明 式 编程 


声明 式 编 程 范 式 审 在 声明 所 澳 的 结 来 ， 而 不 必 处 理 每 一 个 复杂 的 步骤 。 
这 种 艺 式 声明 的 是 希望 实现 哪些 目标 ， 而 非 如 何 实现 目标 ， 程 序 由 此 变 
得 更 短 、 更 向 单 也 更 容 多 阅读 。 


因数 式 编程 ”在 函数 式 编 程 范 式 中 ， 国 数 不 仅仅 征 过 程 。 它 们 用 于 声明 
两 个 或 多 个 元 素 之 间 的 关系 ， 类 似 于 数学 方程 。 在 这 种 郊 式 中 ， 函 数 是 
“头等 公民 ”， 与 其 他 基本 数据 类 型 (如 字符 串 和 数字 ) 的 处 理 方式 并 无 
= 

国 数 既 可 以 传人 其 他 图 数 作为 参数 ， 也 可 以 返回 其 他 国 数 作为 输出 。 具 
备 这 些 特性 的 国 数 因 其 较 强 的 表达 能 力 而 被 称 为 高 阶 范 数 。 国 数 云 范式 
的 这 些 元 素 被 许多 主流 编程 语言 纳入 其 中 ， 条 件 允 许 时 应 充分 利用 它们 
不 几 有 的 表达 能 

例如 ， 大 部 分 国 数 去 编程 语言 都 提供 一 个 通用 的 sort 函数 ， 可 以 对 任 











O 如 果 和 希望 诅咒 其 他 用 户 的 源 代 码 ， 就 叫 它 “面条 式 代 码 ” 吧 。 
© 即 Go To Statement Considered Harmful， 发 表 于 1968 年 3 月 的 《ACM 通讯 》 “被 
认为 有 害 ” 也 因此 成 为 计算 机 科学 与 其 他 学 科 中 经 疝 使 用 的 一 个 词汇 。 一 一 译 者 广 


何 元 系 序 列 排 序 。sort 国 数 传 人 另 一 个 国 数 作为 输入 ， 该 国 数 定义 了 
在 排序 过 程 中 如 何 比较 各 个 元 素 。 假 设 coordinates 畏 数 包含 一 个 地 
HMAK: 给 定 两 个 位 置 时 ，closer_to_home 图 数 将 返回 离 家 更 近 
的 位 置 。 那 么 ， 我 们 可 以 根据 离 家 的 远近 对 位 置 列表 排序 。 





sort(coordinates, closer_to_home) 
高 阶 国 数 通 和 用 于 般 选 数据 。 图 数 云 编 程 语 言 也 提供 一 个 通用 的 
filter än. CRA neen Hu, ANI EE Zë 
RAMEK. Ginn, HAIR P rei, LAETA ke, 


odd_numbers ¢ filter(numbers, number_is_odd) 


number_is_odd 函数 传 入 一 个 数字 作为 参数 ， 如 果 数 字 是 奇数 则 返回 
True， 人 否则 返回 False, 


在 程序 设计 中 ， 经 第 需 要 对 列表 的 所 有 元 素 应 用 一 个 特殊 函数 ， 函 数 式 
编程 将 其 称 为 映射 。 为 此 ， 编 程 语言 通 季 会 提供 一 个 内 置 的 map 函数 。 
以 计算 列表 中 每 个 数字 的 平方 数 为 例 。 

sduared_numbers < map(numbers, square) 
square 图 数 将 返回 给 定数 字 的 平方 数 。 由 于 映射 与 般 选 操作 的 应 用 非 
稼 频 楷 ， 许 多 编程 语言 支持 以 更 人 向 单 的 形式 编写 这 些 表 达 式 。 以 Python 
为 例 ， 我 们 可 以 采用 以 下 方式 计算 列表 中 的 平方 数 。 

squared_numbers = [x**2 for x in numbers] 


这 就 是 所 请 的 语法 糖 ， 它 是 在 语言 中 添加 的 语法 ， 文 持 以 更 简短 的 方式 
编写 表达 式 。 不 少 编 程 语言 邦 提 供 多 种 形式 四 语法 糖 ， 值 得 好 好 利用 。 
最 后 ， 如 采 需 要 在 处 理 值 的 列表 时 产生 单个 结果 ， 可 以 使 用 reduce Gë 


数 ， 它 传 入 列表 、 轧 始 值 、 归 约 国 数 作 为 输入 。 筷 始 值 将 创建 一 个 “ 款 
加 各 ” 变 量 ， 它 将 在 返回 之 前 由 reduce 函数 更 新 列表 中 的 每 个 元 素 。 














function reduce(list, initial_val, func) 
accumulator < initial_val 
for item in list 
accumulator < func(accumulator, item) 
return accumulator 
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例如 ， 可 以 通过 reduce 国 数 对 列表 元 素 求 和 。 


sum < function(a, b): a+ b 
summed_numbers ¢ reduce(numbers, ©, sum) 


使 用 reduce 畏 数 有 助 于 简化 代码 并 提高 其 可 读 性 。 又 如 ，sentences 

是 一 个 句子 列表 ， 如 果 和 希望 计算 这 些 句 子 中 的 单词 总 数 ， 可 以 这 样 处 理 . 
wsum < function(a, b): a + length(split(b)) 
number_of_words e reduce(sentences, ©, wsum) 

split 畏 数 将 字符 串 分 解 为 一 个 单词 列表 ， 而 length 函数 计算 列表 中 

元 素 的 数量 。 

高 阶 国 数 不 仅 能 传人 国 数 作 为 输入 ， 也 能 生成 新 函数 作为 输出 。 此 外 ， 

高 阶 函 数 其 至 可 以 将 对 值 的 引用 包含 到 所 生成 的 函数 中 ， 这 就 是 所 谓 的 

闭 包 。 支 持 闭 包 的 函数 能 “ 记 住 ”内 容 ， 并 访问 所 包 仿 的 值 的 环境 。 

对 于 传 入 多 个 参数 的 函数 ， 可 以 利用 闭 包 将 函数 的 执行 分 解 为 多 个 步 

又， 这 种 技术 称 为 柯 里 化 。 假 设 代码 中 包含 以 下 sum mär, 





sum < function(a, b): a+ b 


sum KHAIRA MATEZ, ER m AeH E. RIAN sum(3) 
返回 的 并 非 数 字 ， 而 古 经 过 柯 里 化 的 新 函数 。 程 序 调 用 sum 函数 并 使 用 
3 作为 第 一 个 参数 ， 对 值 3 的 引用 包含 在 经 过 柯 里 化 的 函数 中 。 例 如 : 


sum_three e sum(3) 
print sum_three(1) # prints "4". 


special_sum e sum(get_number()) 

print special_sum(1) # prints "get_number() + 1". 
请 注意 ， 为 创建 special sum 函数 ， 不 会 调用 与 计算 get number än, 
对 get_number 的 引用 包含 在 special_sum 中 。 仪 当 需 要 对 special_ 
sum 国 数 求 值 时 才 会 调用 eer number 函数 ， 这 就 是 所 谓 的 惰性 求 值 ， 
它 是 国 数 式 编程 语言 的 重要 特征 之 一 。 
闭 包 也 用 于 生成 一 组 苯 循 模板 的 相关 国 数 ， 使 用 国 数 模板 有 助 于 提高 代 
码 的 可 读 性 并 避免 重复 。 举 例如 下 。 





function power_generator (base) 
function power (x) 
return power(x, base) 
return power 


可 以 通过 power_generator Æ akiti RAJA a KR. 


square ¢ power_generator (2) 
print square(2) # prints 4. 


cube e power_generator (3) 

print cube(2) # prints 8. 
请 注意 ， 返 回 的 square 与 cube 函数 保留 了 base 变量 的 值 。 即 便 返 
回 的 两 个 国 数 完全 独立 于 power_generator 畏 数 ， 该 变量 也 仅 存 在 于 
power_generator 的 环境 中 。 再 次 强调 : Din hem är, ol lie 
位 于 目 身 环境 之 外 的 变量 。 


此 外 ， 国 数 的 内 部 状态 也 能 通过 闭 包 进行 管理 。 例 如 ， 为 创建 一 个 素 加 
所 有 给 定数 字 之 和 的 国 数 ， 一 种 方法 站 使 用 全 局 变量 。 


GLOBAL_COUNT < © 

function add(x) 
GLOBAL_COUNT < GLOBAL COUNT + x 
return GLOBAL_COUNT 


可 以 看 到 ， 全 局 变量 会 污染 程序 的 命名 空间 ， 因 此 应 避免 使 用 。 更 “ 干 
净 ” 的 方法 是 利用 闭 包 将 对 昧 加 器 变量 的 引用 包含 在 内 。 


function make_adder() 
n <e 0 
function adder (x) 
nex+n 
return n 
return adder 


RETTE EUELA a MAEHE, 


my_adder < make_adder() 

print my_adder (5) # prints 5. 

print my_adder (2) # prints 7 (5 + 2). 
print my_adder (3) # prints 10 (5 + 2 + 3). 


模式 匹配 KAEDA ORAE R ROXA KA. EA, 2 
们 可 以 根据 输入 来 编写 函数 的 行为 。 以 阶乘 函数 的 输入 模式 为 例 : 
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0!=1 


n!=nX(n-1)! 


函数 式 编程 支持 模式 匹配 ， 即 识别 模式 的 过 程 ， 因 此 可 以 将 阶乘 函数 的 
输入 模 却 简写 为 : 

factorial(0): 1 

factorial (n): n x factorial(m = L) 


相 比 之 下 ， 命 令 式 编程 的 格式 有 所 不 同 。 


function factorial(n) 


else 
return n x factorial(n - 1) 


哪 种 方式 看 起 来 更 清晰 呢 ?” 只 要 条 件 允 许 ， 我 就 会 选择 函数 式 疙 式 。 菏 
些 编程 语言 遵循 严格 的 函数 式 汇 式 ， 所 有 代码 相当 于 纯 数 学 函数 。 这 些 
语言 不 受 时 间 影 响 ， 代 码 中 话 句 的 顺序 不 会 干扰 代码 的 行为 。 在 这 些 语 
言 中 ， 所 有 赋 给 变量 的 值 都 是 非 突变 的 ， 我 们 称 之 为 单 赋值 。 由 于 不 存 
在 程序 状态 ， 没 有 时 间 点 来 改变 变量 。 在 严格 的 函数 式 冰 式 中 计算 时 ， 
仅 涉 及 函数 求 值 与 模式 匹配 。 





8.3.3” 远 辑 编程 


只 要 问题 涉及 一 组 逻辑 公式 的 解 ， 就 可 以 使 用 逻辑 编程 。 程 序 员 利 用 这 
辑 断 言 表示 某 种 情况 (相关 示例 请 参见 1.2 方 )， 然 后 进行 查询 ， 以 便 
从 所 提供 的 模型 中 找 出 管 案 。 计 算 机 不 仅 负 贡 解 释 馆 辑 变 量 与 查询 ， 还 
将 根据 断言 构建 一 个 解 空间 ， 并 搜索 满足 所 有 断言 的 查询 解 。 

逻辑 编程 范式 的 最 大 优点 在 于 几乎 不 用 编写 代码 。 我 们 仅 需要 癌 计 算 机 
提供 事实 、 陈 述 与 得 询 ， 由 计算 机 负 贡 寻找 搜索 解 空 间 并 显示 结 有 末 的 最 
佳 方式 。 

这 种 范式 在 主 度 编程 语言 中 并 未 得 到 很 好 的 应 用 ， 但 如 和 朱 读 者 的 工作 涉 
及 人 工 千 能 或 目 然 语言 处 理 ， 则 应 对 此 子 以 关注 。 











8.4 小 结 | 145 


8.4 人 小结 


计算 机 程序 设计 技术 的 发 展 催生 出 了 新 的 编程 范式 。 这 些 范式 有 助 于 提 
高 计算 机 代码 的 表现 力 ， 也 使 代码 更 为 优雅 。 对 不 同 编程 范式 的 了 解 越 
多 ， 编 号 代码 时 就 越 游 刀 有 余 。 


这 一 草 介 绍 了 程序 设计 如 何 从 直接 将 1 和 0 输入 计算 机 内 存 演变 为 汇编 
代码 。 编 程 由 于 控制 结构 (如 循环 与 变量 ) AE, EH e 
数 有 助 于 更 好 地 组 织 代码 。 

主流 编程 语言 使 用 了 声明 式 编程 冰 式 中 的 菜 些 元 素 ， 这 一 半 对 此 做 了 介 
绍 。 最 后 ， 我 们 人 简要 讨论 了 逻辑 编程 ， 它 是 处 理 茶 些 特定 领域 应 用 的 首 
EN 

ER LEE ET Er AT nl ër, AE Er EHE EZ 
处 。 那 么 ， 现 在 就 开始 编写 代码 吧 ! e 








N 


S> ssa MA 
A 


O Essentials of Programming Languages, Daniel P. Friedman 4% 
口 《代码 大 全 》，Steve McConnell $ 


| 数字 压 数 


附 ` zs 





音 县 可 以 用 数字 表示 ， 因 此 计算 可 以 向 化 为 对 数字 的 操作 。 字 母 可 以 映 
射 为 数字 ， 因 此 文本 可 以 用 数字 表示 。 颜 色 生 红色 、 监 色 、 绿 色 的 组 
合 ， 也 可 以 表示 为 数字 。 图 像 由 彩色 方块 的 马赛 克 构 成 ， 同 样 可 以 表示 


为 数字 。 








HRA FARFI M M) 由 数字 和 构成 。 目 前 使 用 的 数 制 同 样 以 
数字 和 为 基础 ， 但 需要 将 位 置 i 的 数字 乘 以 4 的 i 次 方 ， 其 中 4d 是 不 同 数 
字 的 个 数 ， 称 为 底数 。 人 有 10 个 手指 ， 因 此 通常 以 10 为 底 (d= 10), 但 
数 制 文 持 使 用 任何 数字 作为 捕 数 。 


十 六 进 制 (ei 
以 16 为 底 一 一， ， 
3 2 1 0 i 


Tell me 


ER dok? 


4096 + 0 + 224 + 1 = 4321 4096 + 192 + 32 + 1 = 4321 


八进制 8x 1 = 4096 
x 1 = “4096 Ge 

Gage ， 
x0 = ` A 3 2 1 0-2 ER> — RE 


x 14 = 224 1jej3|4|1| Ri. 4 - E 


十 进 制 10° x 4 = 4000 ”二进制 ` = 


以 10 为 底 一 
3 2 1 0 


以 2 为 底 一 


IO zx 3 — 200 M. j -= 


1211109876543210 


1 
ajaj2|ajj10t x2-20 GoesaEaseeeg|l 27 x1= 


2" x l= 


4000 + 300 + 20 + 1 = 4321 


| 0 = 


10-1 


4096 + 192 + 32 + 1 = 4321 





数字 4321 在 不 同 数 制 ( 底 数 不 同 ) 中 的 表示 


4096 
128 
64 
SE 

] 
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Il BHANAIS 


故事 是 这 样 的 : 作为 惩罚 ， 小 学 老师 要 求 高 斯 将 1 到 100 的 所 有 数字 
相 加 。 不 过 让 老师 感到 惊讶 的 是 ， 高 斯 在 几 分 钟 乙 内 就 算出 了 答案 为 
5$050。 他 的 诀窍 如 下 。 








100 


2x EU 
= =(1+100)+(2+99)+:…+(99+2)+(100+1) 
一 一 一 一 一 
100 对 
=101+101+… 二 101+101 
一 


100 次 
=10 100 


将 10 100 除 以 2 即 得 5050。 可 以 将 这 种 重 排序 正式 写作 >7+ > (n+ 
l-i), 因此 : i=l i=l 


2x 5 = Vit a+- 
i=l i=l i=l 


=X (i+n+1—i) 
i=] 








Il Se 


术语 集合 用 于 描述 对 象 的 集合 。 例 如 ， 可 以 创建 一 个 包含 钦 脸 表情 的 集合 So 
A- 1 ES E Si 
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TR 包含 在 另 一 个 集合 中 的 对 象 的 集合 称 为 子 集 。 例 如 ， 显 示 手 与 腿 的 狐 
ERRAN S =M. ei, S 中 的 所 有 猴 脸 表情 都 包含 在 3 中， 写作 9 CA, 
可 以 将 显示 手 与 中 的 猴 脸 表情 划分 到 另 一 个 子 集中 : % 1 E EI, 








10-2 S, 与 9 是 9 的 子 集 
并 集 可 以 将 属于 A 或 属于 A 的 猴 脸 表情 划分 到 S3 E { A H ai H 3 To 
这 个 新 集合 称 为 前 两 个 集合 的 并 集 ， 写 作 S, =S US 。 
交集 ”可 以 将 既 属 于 5S, 又 属于 e, 的 猴 脸 表情 划分 到 9 = { 阅 ;。 这 个 新 
集合 称 为 前 两 个 集合 的 交集 ， 写 作 9; ESNS. 


SS 注意 ，5; 与 5 仍然 是 5 的 子 集 。 此 外 ， 我 们 认为 S =S 与 空 集 
S= 们 也 是 5 的 子 集 。 计 算 5 的 所 有 子 集 可 知 ， 共 有 2 = 16 个 子 集 。 
如 果 将 全 部 子 集 视 为 对 象 ， 也 可 以 将 它们 纳入 和 集合。5 的 所 有 子 集 的 集 
合 称 为 5 HJR: 


人 E 


IV Kadane 算法 


3.3 市 曾 讨论 过 最 佳 交 易 辣 题 。 
最 佳 交 易 e 我们 了 解 一 段 时 间 内 的 每 日 金价 ， 并 希望 从 中 
找 出 两 个 交易 日 ， 如 果 在 此 期 间 买 入 然后 卖 出 黄金 ， 就 能 实现 
利 | dÉ 最 大 化 。 
3.7 玉 介 绍 了 求解 上 述 问 题 的 一 种 算法 ， 其 时 间 复 杂 度 与 空间 复杂 度 均 
为 O(n), 1984 年 ，Jay Kadane 教授 提出 了 另 一 种 算法 ， 其 时 间 复 杂 度 
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为 O(n)， 而 空间 复杂 度 仅 为 O(1)。 


function trade_kadane(prices): 
sell day é 1 
buy_day e 1 
B é 1 
best_profit < 0 
for each s from 2 to prices.Length 
if prices[s] < prices[buy_day] 
Bes 
profit < prices[s] - prices[B] 
if profit > best_profit 
sell_day es 
buy_day e B 
best_profit e profit 
return (sell_day, buy_day) 


这 征 因 为 无 须 在 输入 的 每 一 天 都 存储 最 佳 天 和 日， 只 需要 存储 相对 于 目 
前 最 佳 买 出 日 的 最 佳 洋 入 日 即 可 。 





结 A 


计算 机 科学 教育 无 法 使 人 成 为 专业 的 程序 员 ， 正 如 研究 画笔 与 
颜料 无 法 使 人 成 为 专业 的 画家 一 样 。 
一 一 埃 里 克 . E RO 


本 书 采用 人 简明 扼要 的 形式 介绍 了 计算 机 科学 中 最 重要 的 一 些 内 容 。 作 为 
一 名 优秀 的 程序 员 ， 了 解 这 些 内 容 有 助 于 夯实 学 习 计 算 机 科学 的 基础 。 


我 希望 这 些 新 知识 能 训 励 读者 深 入 探索 日 己 感 兴趣 的 内 容 。 为 此 ， 每 章 
末尾 提供 了 一 些 优秀 的 参考 资料 ， 并 附 上 相关 链接 。 


受 篇 幅 所 限 ， 本 书 未 能 将 计算 机 科学 的 区 些 重要 内 容纳 入 其 中 。 在 履 善 
整个 地 球 的 网 络 (因特网 ) 中 ， 如 何 实现 计算 机 之 间 的 可 靠 通信 ? 如 何 
使 多 个 处 理 右 同步 工作 ， 从 而 缩短 完成 计算 任务 的 时 间 ? nie 
征 最 重要 的 编程 范式 之 一 ， 本 书 同样 没有 涉及 。 我 计划 在 下 一 本 书 中 探 


讨 这 些 内 容 。 


此 外 ， 只 有 动手 编写 程序 才能 充分 理解 所 学 的 知识 。 这 是 一 件 好 事 。 当 
刚 开 始 学 习 如 何 使 用 编程 语言 完成 基本 操作 上 时， 编写 代码 或 许 难 以 币 来 
回报 ;不 过 一 旦 擎 担 基 础 知识 ， 读 者 必 能 从 中 获得 极 大 的 回报 。 那 么 ， 
现在 就 开始 编写 代码 吧 。 


最 后 ， 本 书 是 我 的 处 女 作 ， 反 啊 如 何 有 待 观察 。 因 此 ， 读 者 的 反馈 对 我 
而 言 价值 连城 。 您 喜欢 哪些 内 容 ? 对 哪些 内 容 感 到 困惑 ? 本 书 哪 里 存在 
改进 的 空间 ?请 致 信 告知 您 的 意见 和 建议 : hi@code.energy。 

















O REH. Eza (1957 一 ), 美国 计算 机 程序 员 ， 黑 客 文化 理论 家 ， 开 源 运 动 主 
要 倡导 者 。 其 闭 作 《大 教堂 与 集 市 》 被 奉 为 开源 运动 的 《圣经 》。 一 一 译 者 注 


后 记 





表情 符号 加 来 日 Twitter 维护 的 开源 项 目 Twemoji。 


FIE K IRIE 1845 年 查尔斯 * 巴 贝 柯 的 分 析 机 原理 图 绘制 。 分 
析 机 是 有 史 以 来 人 类 设计 的 第 一 种 可 编程 计算 机 .。 
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Python 编程 


时 ees 
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算法 图 解 





dé 你 一 定 能 看 懂 的 算法 基础 书 
人 代码 示例 基于 Python，400 多 个 示意 图 ， 生 动 介 绍 算法 执行 过 程 
4 教会 你 用 常见 算法 解决 每 天 面临 的 实际 编程 问题 


作者 : Aditya Bhargava 
译 者 : REG 


Python 编程 : 从 入 门 到 实践 





Amazon 编 程 入 门类 榜首 图 书 

令 从 基本 概念 到 完整 项 目 开 发 ， 帮 助 零 基 础 读者 迅速 掌握 Python 
编程 

dé 零 基础 入 门 


作者 : Eric Matthes 
译 者 : bi 


Python 深度 学 习 


令 Keras 之 父 、Google 人 工 智 能 研究 员 Francois Chollet 执 
笔 ， 深 度 学 习 领 域 力作 
无 需 机 器 学 习 经 验 和 高 等 数学 背景 

令 通俗 易 懂 ， 帮 助 读 者 建立 关于 机 器 学 习 和 深度 学 习 核心 思想 的 直觉 


| 


作者 : URE HE 
译 者 : 张 这 





拉 木 改变 世界 ' 阅读 塑造 人 生 


=- 用 户 思维 +: 好 产品 让 用 户 为 自己 类 叫 


BADASS 


MAKING USERS AWESOME 





% ”好 产品 = 让 用 户 拥有 成 长 型 思维 模式 和 持续 学 习 能 力 
人 人， 极 客 邦 科技 总 裁 池 建 强 、 公 众 号 二 苑 鉴 书 出 品 人 印 岳 作 序 推荐 
en e (ET) 作者 王 坚 、《 谷 歌 和 亚马逊 如 何 做 产品 》 译 者 刘 亦 舟 、 前 


端 工程 师 梁 杰 、 优 设 网 主编 程 远 联 合 推荐 
颠覆 以 往 所 有 产品 设计 观 


a | | Së TL | 
Wi 


u g AER (ES: Kathy Sierra 
guten? fai 


a EVER EA] 


令 知名 博 主 阮 一 峰 文集 ， 一 场 理 解 世界 的 探寻 之 旅 


作者 : 阮 一 峰 


BE 





奔跑 吧 ， 程 序 员 : 从 零 开 始 打造 产品 、 技 术 和 团队 






Hello, Startup 


Sp 
SE 


从 零 开始 打造 产品 、 技 术 和 团队 
N 叶 夫 根 尼 * 布 里 克 县 E ARMOR 


人 入 门 程序 员 如 何 快速 成 为 行业 高 手 

人 程序 员 具 备 哪些 能 力 就 可 以 去 创业 

人 罗 辑 思维 & 得 到 联合 创始 人 快刀 青衣 、 慢 雾 科 技 联 合 创始 人 余 
弦 等 联合 推荐 


Ed E E E KE 


"rr Spee -是 古 Mem 








作者 : DI, 布 里 克 曼 


译 者 : 吴 晓 嘉 








AW TS 








回复 “计算 机 基础 ”查看 相关 书 单 





微 博 连接 





天 注 @ 图 灵 教 育 每 日 分 享 |T 好 书 


名 








QQ 连接 


图 灵 读 者 官方 群 1: 218139230 
图 灵 读 者 官方 群 I[: 164939616 


图 灵 社 区 
iTuring.cn 
在 线 出 版 ,电子 书 ,《 码 农 》 杂 志 , 图 灵 访 谈 





计算 机 科学 无 处 不 在 ， 但 传统 教材 枯燥 无 趣 ， 致 使 很 多 程序 员 从 未 深入 研究 过 
这 一 对 于 实现 高 效 程 序 设 计 人 至 天 重要 的 学 科 ， 也 将 很 多 对 此 话题 感 兴趣 的 非 程 序 员 
挡 在 了 门 外 。 

本 书简 明 扼 要 地 介绍 计算 机 科学 知识 ， 浅 显 易 懂 ， 既 适合 程序 员 巩 固 编程 基 
础 ， 也 适合 普通 人 了 解 计 算 机 科学 和 计算 思维 。 


“计算 机 科学 并 非 一 门 研究 机 器 的 学 科 ， 如 同 天 文学 并 非 研究 记 
en 0 > 29 
远 锐 一 样 。 
一 一 Edsger Dijkstra， 倚 三 计算 机 科学 家 ， 图 灵 奖 得 主 


谈 者 评论 
“这 本 书 帮助 我 巩固 了 过 去 未 曾 掌握 的 计算 机 科学 中 的 难点 。” 


“此 书 名 完美 总 结 了 作者 成 功 地 做 到 了 什么 ， 那 就 是 精炼 每 一 个 CS 概念 ， 并 以 
容易 理解 的 方式 呈现 出 来 。 总 之 ， 这 是 适合 每 个 人 的 计算 机 科学 入 门 书 。 " 


ISBN 978-7-115-49919-6 

图 灵 社 区 : iTuring.cn | 

热线 : (010)51095186 转 600 9 787115"499196"> 

DES DA 计算 机 /计算 机 科学 EN SY 
定价 : 49.00 元 


人 民 邮 电 出 版 社 网 址 : www.ptpress.com.cn 


有 完了 


如 果 您 对 本 书 内 容 有 疑问 ， 可 发 邮件 至 contact@turingbook.com， 会 
有 编辑 或 作 译 者 协助 答疑 。 也 可 访问 图 灵 社 区 ， 参 与 本 书 讨 论 。 


如 果 是 有 关 电 子 书 的 建议 或 问题 ， 请 联系 专用 客服 邮箱 : 


ebook@turingbook.com。 
在 这 可 以 找到 我 们 : 


微 博 @ 图 灵 教 育 : 好 书 、 活 动 每 日 播报 

微 博 @ 图 灵 社 区 : 电子 书 和 好 文章 的 消息 

微 博 @ 图 灵 新 知 : 图 灵 教 育 的 科普 小 组 

微 信 图 灵 访 谈 : ituring_interview， 讲 述 码 农 精 彩 人 生 
WE 图 灵 教 育 : turingbooks 


